好的 BI 不單靠分析人員:高層應多與前線人員溝通!
目前主流的商業智能(Business Intelligence,簡稱:BI)和分析應用主要關注的是如何從已有資料中提取業務價值,反映公司發展、客戶行為和業務趨勢,這種方法是面向過去的。而一些新興的資料分析技術已經把目標投向了未來預測分析。企業通過採用大數據分析技術預測未來可能發生的事情。
但是,預測建立模組和資料抓取技術要想準確地預測出客戶行為,制定有效的企業策略,需要處理大量的多種類型資料;其實要真正落實預測分析,企業需要做的不只是給分析人員配備預測建立模組工具這麼簡單。
現在通常是資料科學家和統計分析人員自己寫演算法,構建預測模型。其實演算法和分析模型需要經歷創建、測試和運行的階段,在資料產生之前,這些工作應該是已經做好了的。“要解決一個問題,其實百分之八十的時間都花在資訊收集上,而資訊收集一開始就應該和業務相關聯繫。”
大數據項目一開始就要有建立模組人員參與其中,建立模組人員需要將自己的數學知識和企業的業務知識相結合。演算法寫的再好也不能為企業解決具體業務問題的。讓資料分析人員和業務人員多交流,讓資料科學家瞭解自己要解決的問題,這樣他們才能充分利用資料,解決業務問題。
技術與業務不能各自為政
大數據分析專案主要是對資料進行挖掘,找出和企業相關的資訊。這個過程中,需要建立模組人員與業務用戶的合作。建模工作不能孤立地完成。
隨著企業不斷的收集、存儲和分析大數據,企業利用資料的方式也在發生改變。一開始的時候,企業更感興趣的是資料收集,把一堆資料放到Hadoop或者其他存儲系統裡。慢慢地,企業更希望合理利用資料,達成具體目標,比如增加利潤、節省支出等。這意味著預測模型的構建需要以具體的業務目標為基礎。
如果建立模組人員不瞭解業務,預測分析就不能發揮出價值。無論是不是大數據,建立模組都應該以特定的業務問題為基礎。我見到過很多公司的資料項目都因為技術人員不懂業務而失敗,結果往往是模組本身很好,但卻沒法實際應用。
成功是來自無數次的失敗
很多公司之中,業務問題和相關的資料集一旦確立,預測模型的開發基本上是一個可反覆運算的過程。分析團隊會創建多種不同的模型,比如線性回歸模型和神經網路模型,從而找出最適合使用的應用程式。在建立模組的同時,技術人員會建立獨立的資料沙盒,包含相關資訊,並且與資料庫隔開。這樣技術人員就可以深入瞭解不同的選項,測試不同的樣板模型。確保模型能夠正常使用。
我們一年前接觸過一家公司,這家公司使用的是SAS軟件供應商的資料建立模組、資料採擷和分析工具。他們的建立模組首先關注的是對保險管理賠償和健康檔案的分析,公司借此判斷哪些患者需要額外的醫療服務、哪些人的症狀表明他有可能患有疾病(比如糖尿病、心臟病)。分析團隊也會關注臨床,幫助患者快速恢復健康,或降低醫療成本。
因為資料科學家需要嘗試不同的方法構建資料模型,所以這個過程要花費較長時間,而且經常會失敗。正因為如此,專案需要獲得高層的支持(金錢上的支持十分重要),這樣才能保證項目能夠持續下去。專案管理者要讓高層瞭解專案的特點,不能讓專案因為失敗或成本過高而停止。