大數據與完美伴侶
大數據與完美伴侶
文︰黃美婷
關關雎鳩,在河之洲。窈宨淑女,君子好逑。《國風·周南·關雎》從古至今,貫穿中外,不論男男女女都為情所困,人人都在尋找自己完美的另一半。我今天要討論的不是兩性關係,而是我在大數據公司工作了一段日子後發現,原來完美的關係和完美的數據有著很多共同之處。
常伴在旁
每個人都希望另一半能在自己有需要的時候陪伴在側,加予支持及安慰,甚至只是簡單一個擁抱,就能勝過千言萬語,而好的數據亦然,可用性(availability)是非常重要的一環。常言道:有價值的數據,在於需要它的時候,就能即刻取得,這樣是最完美的。現時很多應用程式或系統都依賴實時數據,所以在數據流中出現的干擾都會影響最終的分析結果。實時數據能為公司提供更快的剖析及策略,讓公司能更及時回應顧客的需求。我們可以想像每一季時裝的轉換,期間只有短短兩、三個月,而在這段期間包括設計、製造及運輸。可想而知如果能盡早知道顧客對某類時裝有熱烈討論,便能將相關潮流元素加進下季產品設計。
親密與獨立
當兩個人在一段親蜜關係之中,固然會分享自己生活的一點一滴,慢慢變得切都無分你我,但我則覺得在親蜜之中,留有一絲獨立空間和私隱很重要的。在大數據而言,私隱(confidentiality) 是就是一門很重要的學問。公司必須制訂一系列的政策及條例來防止不法之徒取得敏感資料,防火牆及防毒軟件都是必須安裝來保障數據安全性的。公司亦要定期檢視系統,偵測系統中是否有漏洞足以讓不法之徒進入並取得數據。我們可以想像一家公司存有多少顧客的個人資料,尤其是銀行金融行業,載有大量客戶的高度私密資料,如果被不法分子取得,後果不堪設想。除了對外的策略,公司對內亦要訂出一套系統來決定誰人可以存取哪種數據,一般來說,都按職位高低決定,職位越高的可以存取越多數據,反之亦然。
給予保護
當你喜歡一個人的時候,你一定會歇盡所能去保護他/她,讓其免受傷害,大數據亦是非常需要得到你的保護(security),你要想方設法令其免於任何不當使用。大數據對於駭客來說是非常有價值的,任何非法入侵都會導致公司在金和聲譽上落得重大損失。Uber 曾被駭客竊取公司5,700萬客戶及司機的數據,並支付10萬美元希望駭客刪除數據,但最終不果。根據2015年世界經濟論壇的全球風險報告顯示,每年因網路罪案造成的經濟損失逾4,450億美元。另外還有駭客假冒客戶竊取銀行戶口存款、轉售個人資等。由此可見,必須加強系統保安以確保數據安全性。要保護數據,可以透過以下兩種方法,首先是密鎖管理服務(Key Management Service)這是一款管理類服務用來建立和控制用來加密資料的加密金鑰,在密鎖管理服務中,可以根據需要創建、删除和管理加密密鎖。其次,數據存取權限控制,公司可以制定政策來控制公司架構中,誰人可以存取哪類數據,現在已經有很多軟件可以做到這一點,授予每人一個登入帳戶和相應權限、甚至可以在密碼以加增加其他認證方法,例如指紋。
忠貞不渝
正所謂「一次不忠,百次不用」,忠誠在一段關係中是不可劃決的,忠誠對於大數據來說,就是一致性(consistent)、凖確性(accuracy)和可信性(trustworthiness)。正確無誤的數據才能給予公司一個清晰的路向作出決策,尤其現今社會講求透明度,公司內部和對外公開的數據必須確保凖確和一致,不然會招來話柄,數據有誤更會引致公司決策出錯,降低競爭力。不正確的數據值、數量遷移、時區差移都有機會導致數據不一致,公司應該定時檢視系統漏洞,並時時堵塞任何可能導致數據不一致的地方。智能字符識別(Intelligent Character Recognition)和光學字元辨識 (Optical Character Recognition)都是一些自動讀取訊息的軟件,可以減少因人手輸入而帶來的失誤。最重要是明白速度確實是要點,但凖確一致更為關鍵。