chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)中心服務器運維存在哪些痛點

智能計算芯世界 ? 來源:智能計算芯世界 ? 作者:智能計算芯世界 ? 2022-07-25 16:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文來自“數(shù)據(jù)中心服務器智能故障診斷系統(tǒng)”,從云和數(shù)據(jù)中心的發(fā)展趨勢、產(chǎn)業(yè)互聯(lián)網(wǎng)時代的智能化運營需求和TIFDS故障診斷系統(tǒng)進行分析。

f4b4f944-06f5-11ed-ba43-dac502259ad0.png

隨著云技術的普及,尤其是“新基建”,“數(shù)字化轉(zhuǎn)型”等需求驅(qū)動著數(shù)字經(jīng)濟的高速發(fā)展,服務器在CDC數(shù)據(jù)中心的部署規(guī)模也呈指數(shù)級增長。隨之而來的運維管理復雜度和難度也越來越大,而傳統(tǒng)的海量服務器數(shù)據(jù)中心的故障運營也面臨著更大的挑戰(zhàn)和更高昂的成本,從最初的腳本運維、工具運維到平臺運維演進至今,人力已接近極限,越來越無法滿足快速修復故障和恢復業(yè)務運行的要求。

大規(guī)模數(shù)據(jù)中心運維存在如下的痛點問題:

1. 機器故障后,重要的日志信息不全,無法自動準確進行故障部件定位;

2. 故障診斷效能較低,服務器出現(xiàn)問題后主要基于人工分析和經(jīng)驗判斷結(jié)果,自動化與智能化程度不高。

3. 成本高時效性差,人工經(jīng)驗分析依賴大量運維人力投入并導致較長的運維時間(MTTR),影響業(yè)務的快速恢復。

4. 由于診斷結(jié)果的明確化率低,引起二次故障維修比例較高,導致額外數(shù)據(jù)遷移成本和業(yè)務影響。

TIFDS (Tencent&Inspur Fault Diagnosis System) 故障診斷系統(tǒng)是服務器健康監(jiān)管技術及故障預警診斷技術的總稱,旨在實現(xiàn)運維工作任務由人工離線分析向自動智能在線識別的方向發(fā)展,建立一套以帶外BMC為中心的自動化故障診斷系統(tǒng),提升服務器故障預警能力、故障診斷明確率、以及停機維護效率,減少非計劃停機時間,提升服務器全生命周期的健壯的RAS特性(可靠性,可用性及可維護性)。

該系統(tǒng)依托騰訊超過100萬臺服務器的維護數(shù)據(jù),深度定制了服務器事件日志,通過AI技術對服務器運營數(shù)據(jù)進行實時的分析,從而實現(xiàn)了對CPU,內(nèi)存、硬盤,PCIe等設備的自動化預警,將服務器故障診斷自動明確化率提升至95%以上。

f4d7a5d4-06f5-11ed-ba43-dac502259ad0.png

宕機類故障診斷

TIFDS可以覆蓋由于IERR(Internal Error)和非IERR造成的系統(tǒng)宕機故障,并精準地定位出故障部件,如CPU,內(nèi)存,主板,PCIe外插卡,存儲等設備。服務器運行過程中一旦發(fā)生異常,TIFDS系統(tǒng)會立刻響應并準確診斷出故障的部件,將故障問題原因、故障部件具體位置、部件型號信息、維修建議等信息及時上報至運維管理系統(tǒng)。運維管理系統(tǒng)可自動生成維修工單,運維人員根據(jù)維修建議,需要更換部件信息,快捷更換故障部件或者依據(jù)TIFDS指導排除故障,迅速使機器恢復健康狀態(tài)。傳統(tǒng)的以小時計算維修時間級別壓縮至分鐘級別。極大提升運維效率,實現(xiàn)云業(yè)務快速恢復。

f4f4e98c-06f5-11ed-ba43-dac502259ad0.png

非宕機類故障診斷

TIFDS系統(tǒng)通過BMC實時監(jiān)控服務器系統(tǒng)上遍布各處的電壓、電流、溫度傳感器信息,實時監(jiān)控電源、風扇、以及各部件的工作狀態(tài)和工作負荷情況;根據(jù)可在線更新的告警閾值、預警閾值和故障判定規(guī)則,可實現(xiàn)對服務器中存在風險的位置進行故障預警、故障告警或故障判定,并時刻上報智能運維系統(tǒng)。

f505cd88-06f5-11ed-ba43-dac502259ad0.png

故障預警與隔離

TIFDS可以對服務器內(nèi)所有部件進行全生命周期的壽命和運行狀態(tài)進行跟蹤,通過機器學習算法對高風險的部件提前進行預警,降低服務器在高負荷運行狀態(tài)下的突然失效。另外對已發(fā)生故障的部件,TIFDS可以按部件類別做出相應的隔離措施處理,避免單一非必要部件故障影響整機系統(tǒng)的運行。

f5271786-06f5-11ed-ba43-dac502259ad0.png

TIFDS是騰訊云運維監(jiān)控系統(tǒng)中的重要組成部分,是服務器帶外數(shù)據(jù)的主要來源,在內(nèi)存,CPU,PCIe等部件的故障監(jiān)控,失效預測,大規(guī)模告警上有極大貢獻。通過定制化的日志自動適配騰訊云備件系統(tǒng),給騰訊云健康管理系統(tǒng)增加參考維度,并基于帶內(nèi)帶外日志開發(fā)出線上診斷系統(tǒng),深度的定制化模式和簡單易用的維護工具使整個運維系統(tǒng)能更加智能,高效。

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    13

    文章

    9796

    瀏覽量

    88013
  • 數(shù)據(jù)中心

    關注

    16

    文章

    5230

    瀏覽量

    73533

原文標題:數(shù)據(jù)中心服務器智能故障診斷系統(tǒng)

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    銳捷助互聯(lián)網(wǎng)數(shù)據(jù)中心網(wǎng)絡自動化、可視化

    數(shù)據(jù),目前我國規(guī)劃在建數(shù)據(jù)中心達到246個,總設計機架數(shù)約為103萬個,總設計服務器規(guī)模約1326萬臺。在用超大型、大型數(shù)據(jù)中心達37個,總設計機架數(shù)約為20萬個,總設計
    發(fā)表于 01-25 09:42

    基于數(shù)據(jù)中心服務器的新接口測試設計

    本文檔中介紹了基于數(shù)據(jù)中心服務器的新接口測試設計,包含了系統(tǒng)框圖及電路圖。
    發(fā)表于 09-12 11:10 ?5次下載
    基于<b class='flag-5'>數(shù)據(jù)中心服務器</b>的新接口測試設計

    基于大數(shù)據(jù)的高能效數(shù)據(jù)中心服務器研究

    分析ARM服務器的發(fā)展以及應用現(xiàn)狀,結(jié)合數(shù)據(jù)中心的特點,設計基于ARMv8架構(gòu)的高能效數(shù)據(jù)中心服務器,選取目前工業(yè)界具有代表性的ARMv8服務器參數(shù),使用典型的
    發(fā)表于 01-29 13:56 ?0次下載
    基于大<b class='flag-5'>數(shù)據(jù)</b>的高能效<b class='flag-5'>數(shù)據(jù)中心服務器</b>研究

    自動化重要里程碑,騰訊數(shù)據(jù)中心服務臺的正式啟用

    騰訊數(shù)據(jù)中心服務臺是騰訊數(shù)據(jù)中心基礎設施管理的“大腦”——基礎設施中心,集呈現(xiàn)“全球園區(qū)與網(wǎng)絡資源視圖”、“機架、機位、
    發(fā)表于 07-27 17:16 ?2174次閱讀

    數(shù)據(jù)中心服務器接口測試方案

    本文檔內(nèi)容介紹了基于數(shù)據(jù)中心服務器接口測試方案,供參考
    發(fā)表于 03-16 16:26 ?3次下載

    如何才能提高數(shù)據(jù)中心服務器的效率

    研究表明,雖然數(shù)據(jù)中心的能耗成本高昂,但服務器效率也越來越高。每個數(shù)據(jù)中心都擁有運行各種工作負載的大量服務器。無論是企業(yè)數(shù)據(jù)中心、托管
    發(fā)表于 06-01 08:00 ?1次下載
    如何才能提高<b class='flag-5'>數(shù)據(jù)中心服務器</b>的效率

    數(shù)據(jù)中心正從云時代向AI時代進化

    隨著數(shù)據(jù)中心服務器規(guī)模的不斷增加,以及計算網(wǎng)絡、存儲網(wǎng)絡、數(shù)據(jù)網(wǎng)絡的三網(wǎng)融合,數(shù)據(jù)中心人員也迎來了更大的問題,這也讓傳統(tǒng)的人工運
    的頭像 發(fā)表于 07-09 11:48 ?2169次閱讀

    傳統(tǒng)香港服務器數(shù)據(jù)中心正在面臨哪些挑戰(zhàn)

    數(shù)據(jù)中心維護管理重要工種之一,IT出現(xiàn)的問題也映射了傳統(tǒng)數(shù)據(jù)中心正面臨的問題。 今天,恒訊科技小編就給大家分析一下傳統(tǒng)香港服務器
    的頭像 發(fā)表于 04-12 15:13 ?1718次閱讀

    數(shù)據(jù)中心服務器安全白皮書

    電子發(fā)燒友網(wǎng)站提供《數(shù)據(jù)中心服務器安全白皮書.pdf》資料免費下載
    發(fā)表于 08-23 09:25 ?0次下載
    <b class='flag-5'>數(shù)據(jù)中心服務器</b>安全白皮書

    數(shù)據(jù)中心服務器功率一般多大 數(shù)據(jù)中心服務器操作系統(tǒng)三大類包括

    數(shù)據(jù)中心服務器功率一般多大: 數(shù)據(jù)中心服務器的功率大小可以根據(jù)具體的需求和規(guī)模而定。一般來說,數(shù)據(jù)中心服務器的功率會相對較大,以應對大量數(shù)據(jù)處理和存儲的需求。根據(jù)統(tǒng)計
    的頭像 發(fā)表于 01-25 10:10 ?3237次閱讀

    韓國大帶寬服務器數(shù)據(jù)中心位置

    很多用戶會選擇韓國大寬帶服務器,那么韓國大帶寬服務器數(shù)據(jù)中心位置在哪,rak小編為您整理發(fā)布韓國大帶寬服務器
    的頭像 發(fā)表于 03-15 10:47 ?683次閱讀

    分布式管理平臺解決大型數(shù)據(jù)中心難題的案例

    。因此,某大型數(shù)據(jù)中心決定引入分布式管理平臺,以解決過程中的諸多難題。 來百度APP暢享高清圖片 二、平臺實施與功能 資源整合與統(tǒng)一
    的頭像 發(fā)表于 03-26 16:10 ?795次閱讀
    分布式<b class='flag-5'>運</b><b class='flag-5'>維</b>管理平臺解決大型<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>運</b><b class='flag-5'>維</b>難題的案例

    如何選擇數(shù)據(jù)中心服務

    在選擇數(shù)據(jù)中心服務時,需要考慮多個關鍵因素以確保選擇的服務能夠滿足業(yè)務需求并確保數(shù)據(jù)的安全、可靠性和性能。以下是一些關鍵步驟和考慮因素: 一、明確業(yè)務需求 首先,需要明確自己的業(yè)務需求,包括數(shù)
    的頭像 發(fā)表于 10-24 16:14 ?572次閱讀

    浪潮信息升級數(shù)據(jù)中心服務器故障智能診斷AIOps技術

    近日,浪潮信息對其數(shù)據(jù)中心服務器故障智能診斷AIOps技術進行了全面升級。該技術旨在解決數(shù)據(jù)中心服務器日常巡檢中故障人工識別效率低、難以精準定位的問題。 基于數(shù)百萬臺服務器
    的頭像 發(fā)表于 12-31 13:38 ?594次閱讀

    愛普生SG2520HHN晶振數(shù)據(jù)中心服務器的理想解決方案

    系統(tǒng)宕機。愛普生SG2520HHN差分晶振憑借低抖動、寬頻段、高兼容性卓越性能,成為數(shù)據(jù)中心服務器的理想時鐘解決方案。SG2520HHN差分晶振特性與優(yōu)勢:1.超
    的頭像 發(fā)表于 04-29 17:32 ?224次閱讀
    愛普生SG2520HHN晶振<b class='flag-5'>數(shù)據(jù)中心服務器</b>的理想解決方案