數(shù)據(jù)中心網(wǎng)絡(luò)進(jìn)行監(jiān)控和管理如何操作
數(shù)據(jù)中心網(wǎng)絡(luò)進(jìn)行監(jiān)控和管理如何操作
任何數(shù)據(jù)中心中最重要的任務(wù)之一都是對(duì)網(wǎng)絡(luò)設(shè)備,服務(wù)器和數(shù)據(jù)中心本身的監(jiān)控。企業(yè)通常要制定很多的規(guī)劃來(lái)選擇有效的監(jiān)控解決方案和研究數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備的管理方法。
??? 有效的監(jiān)控解決方案對(duì)于維護(hù)數(shù)據(jù)中心網(wǎng)絡(luò)是至關(guān)重要的,部分原因是出于數(shù)據(jù)中心長(zhǎng)期以來(lái)都處在被忽略的地位。在過(guò)去數(shù)年前筆者曾經(jīng)在數(shù)家數(shù)據(jù)中心工作過(guò),筆者的經(jīng)驗(yàn)是專門(mén)駐守?cái)?shù)據(jù)中心監(jiān)控這些問(wèn)題的崗位幾乎從未有過(guò)。事實(shí)上,可能也沒(méi)有人整天待在數(shù)據(jù)中心里。畢竟數(shù)據(jù)中心寒冷而且嘈雜,因此網(wǎng)絡(luò)管理員通常寧愿在別處度過(guò)大部分時(shí)間。有時(shí)管理員甚至都沒(méi)有待在數(shù)據(jù)中心所在的建筑里。在筆者職業(yè)生涯的早期,筆者曾經(jīng)在一家大型保險(xiǎn)公司工作,這家保險(xiǎn)公司的數(shù)據(jù)中心坐落在地下的掩體里。盡管數(shù)據(jù)中心設(shè)計(jì)精巧,但通常只有安保人員在那里工作。其他人都在幾公里外的辦公樓里上班。
??? 無(wú)論管理性是否在數(shù)據(jù)中心里面工作,他們都必須設(shè)置有效的報(bào)警裝置。你無(wú)法假設(shè)某人走進(jìn)數(shù)據(jù)中心去注意控制屏上顯示的故障提示。這也是為什么說(shuō)管理員要確保應(yīng)用了完善的網(wǎng)絡(luò)管理和監(jiān)控解決方案是如此重要。沒(méi)有到位的網(wǎng)絡(luò)管理和監(jiān)控解決方案,你可能只有到電話響起才知道發(fā)生了問(wèn)題。
??? 你必須監(jiān)控什么?
??? 監(jiān)控?cái)?shù)據(jù)中心要制定很多規(guī)劃,這是因?yàn)橛性S多不同的方面都需要進(jìn)行監(jiān)控。你很容易將數(shù)據(jù)中心監(jiān)控看做是服務(wù)器上的制表工作,但實(shí)際上數(shù)據(jù)中心監(jiān)控比這要復(fù)雜的多。舉例來(lái)說(shuō),微軟出品的System Center Operations Manager可以在監(jiān)控Windows Servers上做大量工作,這樣所需的規(guī)劃配置就比較少。但如果你的服務(wù)器運(yùn)行的不是Windows操作系統(tǒng),那么ystem Center Operations Manager就沒(méi)有用武之地。
??? 除了服務(wù)器操作系統(tǒng)和應(yīng)用軟件之外,還有其他的要素需要進(jìn)行監(jiān)控。舉例來(lái)說(shuō),保持?jǐn)?shù)據(jù)中心溫度恒定的監(jiān)控就很重要。多數(shù)服務(wù)器都有內(nèi)置的安全裝置,如果服務(wù)器的溫度超出了特定的臨界值,安全裝置就會(huì)在危險(xiǎn)發(fā)生之前關(guān)閉服務(wù)器。好的監(jiān)控解決方案應(yīng)該能夠告訴你數(shù)據(jù)中心周圍環(huán)境的溫度,如果指定服務(wù)器的溫度開(kāi)始接近臨界值時(shí),監(jiān)控解決方案就會(huì)向你發(fā)出警報(bào)。
??? 能量管理也是如此。如果電源發(fā)生故障,備份電池應(yīng)該能讓服務(wù)器在線維系一定的時(shí)間。規(guī)格更高的數(shù)據(jù)中心可能還會(huì)配備備份發(fā)電機(jī)。無(wú)論如何,你都必須對(duì)電源故障提高警惕,你還需要有到位的解決方案來(lái)了解在某個(gè)指定時(shí)間能提供多少備份電源。
??? 一項(xiàng)好的監(jiān)控解決方案必須向管理員發(fā)出有關(guān)服務(wù)器硬件,操作系統(tǒng)錯(cuò)誤,應(yīng)用軟件錯(cuò)誤,網(wǎng)絡(luò)硬件和環(huán)境改變的各項(xiàng)警報(bào)。這是一項(xiàng)苛刻的要求,退一步說(shuō),這也是為什么說(shuō)正確的規(guī)劃如此重要的原因。就筆者所知,沒(méi)有單一的監(jiān)控解決方案能執(zhí)行所有的這些功能。網(wǎng)絡(luò)架構(gòu)師典型的做法是購(gòu)買幾種監(jiān)控解決方案,對(duì)他們進(jìn)行設(shè)置以統(tǒng)一的方式發(fā)出警報(bào)。這種警告可能是以文本信息的方式發(fā)送到管理員的移動(dòng)設(shè)備或者電子郵箱,或者是以其他類型的警報(bào)形式發(fā)送到技術(shù)支持。重要的事情是所有的警報(bào)都到達(dá)同一地點(diǎn)。
??? 虛擬化讓數(shù)據(jù)中心網(wǎng)絡(luò)監(jiān)控復(fù)雜化
??? 當(dāng)你采購(gòu)監(jiān)控解決方案時(shí),記住某些因素是很重要的,諸如虛擬化,它會(huì)讓監(jiān)控流程變得復(fù)雜。舉例來(lái)說(shuō),在市場(chǎng)上有各種監(jiān)控應(yīng)用軟件能夠監(jiān)控服務(wù)器硬件的故障情況。這種應(yīng)用軟件可能會(huì)對(duì)超標(biāo)的服務(wù)器溫度,SMART磁盤(pán)警告或者服務(wù)器內(nèi)的制冷風(fēng)扇故障做出提示。問(wèn)題是如果監(jiān)控解決方案無(wú)法獲知他們監(jiān)控的是虛擬機(jī),它也不可能知道硬件系統(tǒng)會(huì)對(duì)服務(wù)器可用性存在潛在影響。
??? 監(jiān)控軟件處理的應(yīng)該是主服務(wù)器硬件出現(xiàn)的問(wèn)題。但是如果主服務(wù)器處于危險(xiǎn)之中,那么任何在主機(jī)上運(yùn)行的虛擬機(jī)也面臨同樣的問(wèn)題。因此如果你的企業(yè)想部署虛擬機(jī),你就必須要辦法能區(qū)分物理服務(wù)器和虛擬服務(wù)器,了解那個(gè)虛擬機(jī)在那個(gè)主服務(wù)器上運(yùn)行。在硬件發(fā)生故障時(shí),你還必須具備將客戶端服務(wù)器快速遷移到不同主服務(wù)器上的能力。
??? 最后,管理和監(jiān)控是息息相關(guān)的。只有企業(yè)具備完善的管理能力能才保證監(jiān)控發(fā)揮作用。舉例來(lái)說(shuō),如果管理員沒(méi)有辦法解決出現(xiàn)狀況的服務(wù)器發(fā)生的故障,監(jiān)控軟件又告訴你就要發(fā)生故障該如何是好呢?因此將監(jiān)控和將數(shù)據(jù)中心內(nèi)每臺(tái)服務(wù)器與每個(gè)硬件的主要組件的遠(yuǎn)程管理相結(jié)合是非常重要的。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
相關(guān)閱讀:
- [電子說(shuō)] 大數(shù)據(jù)的3V、4V、7V,到底是什么意思? 2024-12-06
- [電子說(shuō)] 浪涌保護(hù)器在數(shù)據(jù)中心的重要性 2024-12-05
- [電子說(shuō)] AI數(shù)據(jù)中心的布線考量 2024-12-05
- [電子說(shuō)] 英特爾為企業(yè)智能化發(fā)展注入新動(dòng)力 2024-12-05
- [電子說(shuō)] UPS不間斷電源的常見(jiàn)故障及解決方法 2024-12-04
- [電子說(shuō)] UPS不間斷電源與發(fā)電機(jī)的區(qū)別 高效節(jié)能的UPS不間斷電源選擇 2024-12-04
- [電子說(shuō)] 英威騰參編機(jī)房空調(diào)國(guó)家標(biāo)準(zhǔn)發(fā)布 2024-12-04
- [電子說(shuō)] 科華數(shù)據(jù)參編《西藏金融數(shù)據(jù)中心建設(shè)規(guī)范》近日發(fā)布 2024-12-04
( 發(fā)表人:admin )