大數據時代來臨:數據中心架構應如何是好?
大數據(Big Data)的核心價值在於從海量的複雜資料中挖掘出有價值的資訊,通過大數據技術進行更快地分析、更準確地預測,發掘出新的業務模式,創造新的商業發展機會。因此,大數據時代下,企業迫切需要思考如何應用大數據技術,以及改造完善已有大數據平台,提升企業的資料處理能力,提高資料分析水準,將大數據融入企業的整體資料方案。
部署大數據分散式處理模式
分散式處理模式是大數據時代下數據中心架構的基本要求,包括分散式存儲和分散式運算。分散式存儲採用了可擴展的系統架構,利用多台存伺服器分擔存儲負荷,它不但提高系統的可靠性、可用性和存取效率,還易於擴展。分散式運算將大量的分析計算任務分解為若干小任務,然後將分解後的任務分配到不同的處理點,最後將計算結果綜合起來得到最終的結果。分散式運算具有更強的平行計算能力和擴展性,且適合多類型資料的混合處理,因此,電訊企業需要在原有數據中心架構基礎上,建立分散式處理模式,提升資料存儲和處理能力。
研究建立大數據分析處理架構
電訊企業數據中心現有的技術架構用來研究大數據關鍵技術,結合目前行業主流的大數據處理架構,重點研究基於大數據平台的數據中心資訊基礎架構,在保護企業現有資訊化投資的基礎上,探索適合自己的大數據解決方案,將大數據融入企業整體資料方案。利用大數據技術改造完善數據中心分析處理架構,研究融合結構化資料、即時資料、位置資料和非結構化資料的大數據資訊基礎架構,建立企業級大數據分析與挖掘平台,實現不同類型資料的融合集成與關聯分析,支撐大資料分析應用,提升資料分析和挖掘能力。
利用大數據分析創造價值
資料的核心是發現價值,管理資料的核心是分析。如何管理大數據,如何在海量資料中挖掘有價值的資訊是最重要的,因此企業更應專注於資料中隱藏的價值,通過應用大數據技術分析,充分挖掘資料的核心價值,不斷優化業務流程,降低管理成本,協助企業做出科學的決策,為企業帶來持續創新的力量。
資訊的影響力取決於資料關聯的能力,結合多個大數據所獲得的新洞察力要遠遠超出單一大數據所獲得的洞察力。例如種子公司與農作物保護供應商和氣象部門合作就綜合利用了多個大數據,又例如天氣資料、土壤濕度資料、土壤類型資料、種子資料和其他資料,對這些資料進行交叉關聯分析,可以幫助種植戶收穫更高的產量,同樣都是利用多個大數據。
如何讓資料驅動業務
如何讓資料驅動業務,這是大數據時代下數據中心必須思考的關鍵問題。傳統數據中心疲於應付業務部門的需求,而大數據時代下,資料的複雜性決定了數據中心需要更加快速地應對業務需求的變化和不確定性,因此數據中心必須將資料的保管者和服務者轉變為資料的管理者和決策者,從被動的回應業務部門的要求轉變為主動向業務部門提供資料。
資料驅動業務是指數據作為一種生產力將資料分析挖掘的即時資訊、主動地回饋給業務決策者並影響企業業務的過程。大數據時代下,可以對企業業務進行全方位分析、全方位監控、模擬預測,即時進行回饋,並及時調整決策改善業務發展方向,從而使業務可以資料評價並作出資料決策。