IT 人準時收工非難事:維護自動化策略及部署建議
隨著企業伺服器數量越來越多,當數量到達幾百、幾千部以後,伺服器日常的管理也變得複雜,如果每天通過人手去更新或者部署及管理這些服務器,會浪費大量時間,而且人為的操作也會造成某些疏忽和遺漏。現在我們來看看傳統的維護以及今後維護的發展方向。
A、傳統維護:
傳統的 IT 維護是等到 IT 故障出現後,再由維護人員採取相應的補救措施。這種被動的 IT 維護管理模式經常讓 IT 部門疲憊不堪,從以下三方面可以看到:
1、維護人員被動、效率低
在 IT 維護過程中,只有當事件已經發生並已造成業務影響時,維護人員才能發現和著手處理,這種被動「救火」不但使 IT 維護人員終日忙碌,也使 IT 維護本身的質素難以提高,導致 IT 部門和業務部門降低對 IT 維護的服務滿意度。
2、缺乏一套高效的 IT 維護機制
目前許多企業在 IT 維護管理過程中缺少自動化的維護管理模式,也沒有明確的角色定義和責任劃分,導致問題出現後難以快速、準確地找到根本原因,無法及時地找到相應的人員進行修復和處理。或者是在問題找到後,缺乏流程化的事故處理機制,而在處理問題時不但欠缺正確的解決方案,也缺乏全面的跟蹤記錄。
3、缺乏高效的 IT 維護技術工具
企業 IT 系統日漸複雜,林林總總的網絡裝置、伺服器、中間件和業務系統等,讓 IT 維護人員難以應對,即使加班維護、部署和管理都會因裝置出現故障而導致業務中斷,嚴重影響企業的正常運作。其原因是企業缺乏事件監控和診斷工具等 IT 維護技術,在沒有高效的技術工具支持下,事件很難得到主動、快速的處理。
B、自動化維護
IT 維護已經走過一段很長時間,如今它正以一種全新的姿態出現在我們面前,自動化是 IT 技術發展的必然結果。現在 IT 系統要求 IT 維護必須能夠實現數碼化、自動化維護。
維護自動化是指將 IT 維護中會重複發生的工作自動化,把過去的人手執行轉為自動化操作。自動化是 IT 維護工作的升級,IT 維護自動化不只是一個維護過程,更是一個管理過程的提升,是 IT 維護的最高層次,也是未來的發展趨勢。
1、維護自動化的具體內容
日常的 IT 維護中,大量重複發生的工作(小的工作有簡單的日常檢查、配置變更和軟件安裝,大的工作有變更整個流程的組織安排)由過去的人手執行轉為自動化操作,從而減少維護中的延遲,實現「零延遲」的 IT 維護。
簡單的說,IT 維護自動化是指基於流程化的框架,將事件與 IT 流程相聯起來,一旦監控系統發出警報,會觸發相關事件以及事先定義好的流程,自動啟動事故應對和復原機制。
2、建立高效的 IT 自動化維護管理
建立高效的 IT 自動化維護管理的步驟主要包括以下幾點:
1)建立自動化維護管理平台
IT 維護自動化管理建設的第一步是要先建立 IT 維護的自動化監控和管理平台。通過監控工具對用戶操作的約束和對 IT 資源進行實時監控,包括伺服器、數據庫、中間件、存儲備份、網絡、安全、機房、業務應用和客戶端等內容,通過自動監控管理平台實現故障或問題綜合處理和集中管理。
2)建立事故的自動觸發流程,提高故障處理效率
所有 IT 裝置在遇到問題時會自動發出警報,無論是系統自動警報還是人手的警報,應以紅色標籤顯示在屏幕上。然後 IT 維護人員只需要按照相關步驟,一步一步操作就可以。
3)建立事件跟蹤流程,強化維護執行力度
需要建立故障和事件處理的跟蹤流程,利用表格工具等記錄故障及其處理情況,以建立維護日誌,並定期回顧從中辨識和發現問題的線索和根源。
4)設立 IT 維護關鍵流程,引入優先處理原則
設置自動化流程時還需要引入優先處理原則,例行的事件按照常規處理,特別事件要按照優先次序處理,也就是把事件細分為例行事件和例外關鍵事件。
5)IT 自動化維護工具簡化維護管理
根據 IT 環境選擇合適的自動化維護工具,是一個有效的維護手段。自動化維護工具能實現對 IT 資產的實時監控,維護人員通過系統的統一界面即可了解所有軟硬件裝置的狀態。自動化維護工具還可以實現故障定位,一旦出現問題,系統會及時通知負責人,並找出故障位置,大大縮短檢查時間。