小問題未發大先化解:別忽略虛擬環境管理工作
管理虛擬環境並不容易。即使部署規模很小,管理員仍然需要注意很多發生在背後的事。不進行合理的規劃並關注當中的變化,即使是很小的問題也可能導致失控。以下列出常見的幾個問題?
缺少正確配置管理的規劃
如果配置管理不正確,那麼距離犯錯就不遠。無論是公有雲還是私有雲,你必須規劃虛擬環境的伺服器配置並掌控變化。你可以詢問Linux專家,他們將會花很長的時間向你表達Puppet或者Chef的優勢。如果詢問有經驗的Windows管理員,他們同樣會向你講述DSC的優勢。
你需要採用準確的配置,快速、輕鬆地部署伺服器,而不是要以沉長又複雜的Script以及漫長的平台進行測試。你還需要控制伺服器隨時間變化而發生的改變。
虛擬環境出現問題時,你要問的第一個問題就是「發生了哪些改變?」硬件出問題的情況是很少見的,大多數伺服器連接中斷是由於某些人對配置進行了有意或無意的調整。避免這些中斷並採用合理的配置將會對環境進行更好的控制。可以選擇相應的工具:Puppet、Chef 或者 DSC。無論選擇哪一個,在出問題之前先要做好配置管理。
小心問題陷阱
在現今的虛擬環境中,軟件安裝、配置及維護帶來的問題越來越少。虛擬化方面逐步採用配置導向以及預先進行配置設備,專家以外的人都能夠建立並維護虛擬環境了。這正正是問題所在。技術不存在問題,存在問題的是認可性。外表簡單可能表示底層很復雜,問題只是冰山一角。
儘管虛擬環境看起來很簡單,但安裝、配置及管理卻很複雜。在理想情況下,我們不會發現任何問題因為一切都正常。而檢查時假如發現了問題存在,技術人員便必須與顧問以及廠商一同查出問題,這時對底層知識了解得越多越好。這並不是說你必須要求自己解決該問題,但能夠正確地揪出問題所在的確是恢復系統的一個關鍵步驟。
通過採用虛擬化或者將核心應用遷移到雲端,企業能夠避免大多數的問題。這個行動可以消除了犯錯及維護的可能性,現代Data Center中的雲端服務能滿足組織需求。然而雲端服務亦會有可能發生中斷,因此在將核心應用遷移到雲端之前當然仍需因實際情況而再三考慮。
組織開始採取虛擬化路線,無論是私有雲還是公有雲,一定要確保員工有很好的培訓,他們不需要是專家,但也不應該對此感到畏懼。虛擬化能夠為組織提供令人驚嘆的優勢,但是需要進行很好的控制否則可能會變成可怕的怪獸。
忽視虛擬基礎設施
你可能犯了最大的錯誤,因為你可能忽視虛擬基礎設施。伺服器使用時間逐漸增加,你可能會繼續使用舊軟件、很少更新,對存儲或網絡疏於管理,有可能因為一台伺服器只運行著一個應用。在採用伺服器虛擬化後忽視這些基本的工作可能會影響性能,更差的現象可能是會導致上百台伺服器一起當機。所有 hypervisor、伺服器以及存儲一直在革新,同時會發現bug。運行在基礎設施之上的虛擬機中Workload數量同樣呈倍數增長,由於虛擬環境涉及眾多硬件,也難怪會出現問題導致當機或者影響性能了。
關鍵是對基礎設施有一個全面的了解,同時要關注它的性能。如果環境未發生任何變化但你突然發現運行不穩定時,那麼你要了解的就是哪個 Layer 負載過高導致性能出現問題。為展開此項工作,你需要選擇具備診斷功能又能夠進行分析的工具。這些工具能夠提高工作效率,消除日常管理煩惱。
環境的清單缺少管理及維護
另一個管理虛擬環境最大的錯誤就是沒有一個系統來管理和維護環境。中小企業不會部署獨立系統來記錄它的配置信息、使用情況或者主機的位置等。發生災難時,這些信息對快速回復十分重要,不幸的是這一工作往往被忽略。