淺談:數據大量產生的管理哲學(1)
淺談:數據大量產生的管理哲學(1)
現時,不論是大小企業,都正在面對著一個問題,那就是數據量膨脹問題,其中的原因不外乎就是用户依賴電腦作更多事情。
例如用户可通過公司新開發的手機應用程式直接購買產品、得知最新的資訊、進行交易等等,各式各樣的創新商業手法,除了為用戶帶來了方便及提升公司的形象之外,背後亦為公司帶來了龐大的數據量,要處理這些數據,企業需要制定相關的策略才可。
根據一份由 EMC 發表的數碼宇宙(Digital Universe)研究報告便清楚指出;到了 2020 年數據量膨脹將達 10 倍之多。報告透過 IDC 的調查及分析發現,無線網絡技術、智能產品和軟件定義企業的冒起如何在全世界急劇增長的數據中扮演核心的角色。物聯網的興起亦間接令數碼宇宙的數據量每隔兩年翻一倍,在 2013 至 2020 年之間更激增 10 倍,由 4.4 兆 GB 攀升至 44 兆 GB。
可能大家對 44 兆 GB 這數字還沒有很清晰的概念,就讓我們將這個極大的數據量化身成易明一點的展示方式。
– 如果用 iPad Air 儲存數碼宇宙的數據量,這些 iPad Air 疊起來的高度,是地球與月球距離的三分之二(157,674 英里/253,704 公里)。到 2020 年,這幢 iPad Air 的高度將達到地球至月球距離的 6.6 倍。
– 現時,一般家庭每年生産的數據足以填滿 65 部 iPhone(32GB),到 2020 年,數據量將可填滿 318 部 iPhone。
– 現時,如果用一加侖水代表 1 byte 數據的話,只需 10 秒,這些水就可填滿一個標準的平房;到了 2020 年的時候,只需 2 秒就可填滿。
是不是很嚇人呢?面對這急速的數據膨脹,企業需要制定相關的應對方法,而這次我們將會與大家分享一下編輯部門對數據膨脹的處理方法上的一些做法及看法,希望能幫到大家作出最佳決定。
先了解數據來自那裡
要制定好處理數據的策略,第一件事情就是需要了解數據來自那裡,正所謂「知己知彼、百戰百勝」。
而這方面我們可不能幫到你,需要靠你自己去發掘,事關不同公司有不相同的情況,不過就全世界而言,企業的數據可分為來自內部及來自於外部的。以下我們便引用一份來自 PURE FUNDS 的資料,當中分別顯示全球大多數企業的數據是來自於那裡。
來自於內部的:
1. 歸檔類
例如是:掃描的公司內部文件、與客戶之間的溝通錄音、客戶資料等。
來自於外部的:
1. 互聯網
例如是:來自於政府刊登的資料、經濟相關的資料、行業趨勢分析等相關資料、調查等相關資料。
來自於外部或內部的:
1. 社交網絡
例如是:來自於 Facebook、Twitter、LinkedIn、Youtube 等平台的資料。
2. 文書相關資料
例如是:來自於電郵、Word、Excel、PDF、PPT、HTML 及純文字檔案等的資料。
3. 商業應用資料
例如是:來自於計劃管理應用、人事管理應用、市務相關的應用、CRM 等的資料。
待續…
瀏覽相關文章
淺談:數據大量產生的管理哲學(1)
談海量數據:大數據下的 Data pipeline 應如何制定?
談海量數據:大數據下的 Data pipeline 應如何制定(1)?
談海量數據:淺談外判 Data pipeline 要注意的事項