3?持續(xù)構(gòu)建精細(xì)化運營系統(tǒng)
數(shù)據(jù)中心基礎(chǔ)設(shè)施精細(xì)化運營的真正潛力在數(shù)據(jù),數(shù)據(jù)中有效信息分布在不同的解決方案與DCIM工具中,信息的整合貫穿運營的每個環(huán)節(jié),是實現(xiàn)精細(xì)化運營、構(gòu)建競爭力、改變市場格局的有效手段。實現(xiàn)數(shù)據(jù)中心的精細(xì)化運營,可遵從ITIL的服務(wù)理念,圍繞數(shù)據(jù)中心持續(xù)高可用、資源最大化利用以及服務(wù)運營持續(xù)構(gòu)建。
3.1?高效,持續(xù)高可用
通過系統(tǒng)的監(jiān)控和管理,確?;A(chǔ)設(shè)施的持續(xù)高可用性;通過數(shù)據(jù)的采集與分析,提升資源的利用率;通過自動化的運維模型,提升管理效率,降低成本,實現(xiàn)業(yè)務(wù)服務(wù)的敏捷化。
精細(xì)、廣泛的管理
基礎(chǔ)設(shè)施的精細(xì)化、廣泛的管理,建立在統(tǒng)一、完備的管理模型基礎(chǔ)之上,DMTF發(fā)布的通用信息模型CIM框架提供了操作系統(tǒng)、應(yīng)用程序、網(wǎng)絡(luò)和設(shè)備管理的基本模型,但要實現(xiàn)基于業(yè)務(wù)、應(yīng)用的管理,則需要對模型做合適的擴展,以滿足運營的基本要求。
在構(gòu)建高效、持續(xù)高可用的運營系統(tǒng)的過程中,滿足ITSM管理要求統(tǒng)一的數(shù)據(jù)模型的基本要求包括:
1、自動的數(shù)據(jù)采集,設(shè)備管理、傳感網(wǎng)絡(luò)可持續(xù)采集和集中處理數(shù)據(jù)。
2、具有虛擬現(xiàn)實的建模能力,包括IT與基礎(chǔ)設(shè)備在內(nèi)的資源,可準(zhǔn)確的反應(yīng)現(xiàn)場的配置。
3、所見即所得,可視化的變更、配置,深入到CRAC、行、機架等級,實時可見的能力,可避免主觀臆斷的移動、添加、以及改變數(shù)據(jù)中心的配置。
4、可持續(xù)跟蹤IT資產(chǎn)的財務(wù)數(shù)據(jù)(購買日期、成本)以及物理數(shù)據(jù)(機架中的位置)的變化,實現(xiàn)生命周期內(nèi)的資產(chǎn)管理。
5、數(shù)據(jù)中心的能力規(guī)劃與預(yù)測,集中式的電源、散熱、空間、網(wǎng)絡(luò)占用計算可預(yù)知機架能力變化,提高資產(chǎn)利用率。
借助統(tǒng)一的數(shù)據(jù)模型、組件化及網(wǎng)絡(luò)構(gòu)建能力,DCIM能夠管理分散的、不斷增加的成組應(yīng)用,支持、收集開局、擴容、遷移、退網(wǎng)等場景下的配置、變更信息,并進行相關(guān)處理,提供相關(guān)信息,支持決策。用戶可在一個集中可視化視圖中,以一種更直觀、有效的方式來反映當(dāng)前部件狀態(tài)并執(zhí)行控制任務(wù)。
前瞻性的問題管理
IDC管理系統(tǒng)通過對基礎(chǔ)設(shè)備、連續(xù)供電系統(tǒng)、連續(xù)供冷系統(tǒng)的監(jiān)視、預(yù)測,管理粒度細(xì)化到設(shè)備的運行指標(biāo)級,深入洞察,實現(xiàn)問題的前瞻性管理。
實現(xiàn)對管理信息的簡潔化訪問,降低響應(yīng)的時間,減少非計劃的停機;消除故障,在問題沒有發(fā)生之前預(yù)知;與ITSM的集成,事件管理、問題管理流程化,自動化,是前瞻性管理的必要手段:
1、通過對連續(xù)供電、連續(xù)供冷系統(tǒng)的監(jiān)控,感知系統(tǒng)、設(shè)備的輸出能力以及性能下降,并對可能的業(yè)務(wù)影響進行分析,給出預(yù)警。
2、利用容量管理,實現(xiàn)機柜級的供電、制冷、空調(diào)、網(wǎng)絡(luò)的分析,規(guī)避資源沖突,在確保資源最大化利用的基礎(chǔ)上,提供連續(xù)的服務(wù)。
3、提供連續(xù)、實時的監(jiān)控工具,通過信息的簡潔化、快速訪問,降低系統(tǒng)或者網(wǎng)絡(luò)的停機時間,縮短MTTR。
4、結(jié)合事件、問題管理流程,規(guī)避流程外的疏忽和遺漏,保障服務(wù)的持續(xù)可用性與SLA。
智慧數(shù)據(jù)中心針對設(shè)備故障、運行性能的下降,提供容量、事件、問題管理等功能,可以預(yù)定義門限和條件,接收并處理告警、事件信息。
針對問題管理,管理系統(tǒng)利用知識庫、實踐經(jīng)驗庫,配置相應(yīng)的功能集,當(dāng)業(yè)務(wù)系統(tǒng)、應(yīng)用子系統(tǒng)或部件的可用性降低或者故障時,可自動感知、并實現(xiàn)主動的管理,進行自診斷、自恢復(fù)操作。使得IT人員可聚焦主要的職責(zé),開展主要的業(yè)務(wù)。
評論