chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

TECS資源池上報BFD會話DOWN和網(wǎng)絡流量異常告警的問題處理

中興文檔 ? 來源:中興文檔 ? 2023-06-07 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

某資源池TECS上報BFD會話DOWN告警和網(wǎng)絡流量異常告警,持續(xù)時間1秒至6分鐘不等,如下圖所示。

4feac93c-0485-11ee-90ce-dac502259ad0.png

同時,業(yè)務側反饋,該資源池ISBG業(yè)務網(wǎng)元產(chǎn)生指標下降等異常情況,但已快速恢復。

物理節(jié)點上的虛擬機都通過業(yè)務面網(wǎng)卡和節(jié)點外部通信。當流量異常時,業(yè)務網(wǎng)卡上會出現(xiàn)很多丟棄包。

系統(tǒng)周期性采樣網(wǎng)卡所有收發(fā)包總數(shù)和丟棄包總數(shù),當丟棄包占比數(shù)連續(xù)多次超過門限時,則上報告警;當連續(xù)幾個采樣周期的丟棄包占比數(shù)低于門限,則恢復告警。

虛擬網(wǎng)絡上出現(xiàn)較重負荷,造成報文丟棄率超過給定閾值。短暫的指標下降異常情況可能和資源相關,例如CPU、內(nèi)存、網(wǎng)絡資源不足,或者硬盤的IO讀寫過低導致延遲。

問題分析過程如下:

1.觀察到異常情況后,對告警內(nèi)容展開分析。執(zhí)行dvs show-dpifstats命令,找到對應端口,查看overrun和drop統(tǒng)計項是否在增加。

2.觀察到計算服務器NFV-D-XXX-SRV-15業(yè)務bond子接口均上報了網(wǎng)絡流量異常告警,分析可能是端口丟包。

3.登錄服務器查看DVS日志,端口丟包量在告警時刻出現(xiàn)上漲,如下圖所示。

500e8836-0485-11ee-90ce-dac502259ad0.png

4.登錄云平臺查看NFV-D-XXX-SRV-15承載業(yè)務,該主機承載虛機四臺,其中包含ISBG的XX-isbg-OMPIPI_2_L虛機。分析可能為DVS接收丟包影響到虛機業(yè)務。

5.分析SAR日志,確認DVS的綁定核在故障期間出現(xiàn)被占用的情況,時間點與網(wǎng)卡丟包基本一致,認定為DVS核占用導致的DVS物理網(wǎng)卡丟包,如下圖所示。

5030ab3c-0485-11ee-90ce-dac502259ad0.png

6.分析BMC黑盒子日志,該時間(+8)在日志中大量出現(xiàn)ECC內(nèi)存錯誤,內(nèi)存定位DIMM11,如下圖所示。

504fd5ac-0485-11ee-90ce-dac502259ad0.png

7.ECC錯包出現(xiàn)的時間點與DVS網(wǎng)卡丟包時間點(DVS轉發(fā)核被占用的時間點)基本重合,認定內(nèi)存ECC錯誤與DVS的丟包強相關。

8.根據(jù)日志顯示報錯信息,ECC內(nèi)存錯誤觸發(fā)的內(nèi)存槽位為DIMM11。

1.登錄管理頁面,選擇“云平臺管理-計算-實例”,選中該臺主機上虛擬機,完成主機上虛擬機的熱遷移,如下圖所示。

507207b2-0485-11ee-90ce-dac502259ad0.png

2.完成遷移后,選擇“云平臺管理-計算-主機”,選中這臺主機,設置維護模式,如下圖所示。

5093f0d4-0485-11ee-90ce-dac502259ad0.png

3.下電服務器完成內(nèi)存更換,完成后上電,取消“設置維護模式”。

4.遷移回虛擬機,測試正常。

5.內(nèi)存ECC錯誤為此次異常故障根因。內(nèi)存ECC錯誤影響DVS轉發(fā)分析:

l在內(nèi)存ECC錯誤故障期間,現(xiàn)有的BIOS配置會為每一個內(nèi)存ECC錯誤產(chǎn)生一個SMI中斷。

如果產(chǎn)生ECC風暴,那么影響CPU處理性能。

SMI中斷在內(nèi)核感知為NMI,不受內(nèi)核控制,從硬件描述看內(nèi)核是無法屏蔽此類中斷的。內(nèi)存ECC默認不告警。

SMI中斷導致CPU進入SMM模式,該模式對于OS是透明的。

因此SMI中斷是硬件和固件(BIOS)共同處理的,其對于CPU處理流程的打斷,對OS而言是不可感知的,不會出現(xiàn)在OS的統(tǒng)計項里面。

只有當BIOS處理SMI后,并以SCI中斷通知OS時,OS才能感知到SCI中斷。但是BIOS是否觸發(fā)SCI中斷也不是OS所能控制的。

總之,SMI中斷對于DVS處理核的影響是硬件和固件的行為。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SAR
    SAR
    +關注

    關注

    3

    文章

    437

    瀏覽量

    47711
  • BIOS
    +關注

    關注

    6

    文章

    474

    瀏覽量

    47993
  • ECC
    ECC
    +關注

    關注

    0

    文章

    100

    瀏覽量

    21538
  • 虛擬機
    +關注

    關注

    1

    文章

    968

    瀏覽量

    30151
  • SCI
    SCI
    +關注

    關注

    1

    文章

    59

    瀏覽量

    20789

原文標題:TECS資源池上報BFD會話DOWN和網(wǎng)絡流量異常告警的問題處理

文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    線路保護光纖通道異常處理方法

    通道異常的 常見原因、處理步驟及預防措施 ,幫助運維人員快速定位問題,提升故障處理效率。 廣州郵科光纖線路保護系統(tǒng) 一、光纖通道異常的常見表現(xiàn) 當線路保護光纖通道出現(xiàn)
    的頭像 發(fā)表于 11-17 10:01 ?337次閱讀
    線路保護光纖通道<b class='flag-5'>異常</b><b class='flag-5'>處理</b>方法

    構建高可靠網(wǎng)絡:硬件BFD的關鍵作用

    BFD Acceleration(BFD加速)指的是一系列通過硬件卸載或內(nèi)核優(yōu)化技術,將BFD報文的處理從設備的中央處理器(CPU)轉移到專
    的頭像 發(fā)表于 11-06 11:09 ?854次閱讀
    構建高可靠<b class='flag-5'>網(wǎng)絡</b>:硬件<b class='flag-5'>BFD</b>的關鍵作用

    交換機光模塊收發(fā)光超閾值無告警問題的處理方法

    某互聯(lián)網(wǎng)電視CDN網(wǎng)絡使用ZXR10 5960-56QU-HC交換機作為承載設備,通過光口與城域網(wǎng)設備以及CDN服務器對接,承載互聯(lián)網(wǎng)電視視頻流量。日常運行中發(fā)現(xiàn)設備沒有上報光模塊收發(fā)光超閾值
    的頭像 發(fā)表于 10-16 09:34 ?354次閱讀
    交換機光模塊收發(fā)光超閾值無<b class='flag-5'>告警</b>問題的<b class='flag-5'>處理</b>方法

    信而泰×DeepSeek:AI推理引擎驅動網(wǎng)絡智能診斷邁向 “自愈”時代

    ,還是工業(yè)協(xié)議時序混亂,均可完整還原端到端業(yè)務會話鏈條,為智能分析提供堅實基礎。2.AI根因定位:推理引擎驅動秒級精準診斷l(xiāng) 知識圖譜驅動:將網(wǎng)絡拓撲、流量統(tǒng)計、歷史趨勢、會話日志、
    發(fā)表于 07-16 15:29

    TECS OpenStack資源池虛擬機網(wǎng)絡二層地址無法互通的問題處理

    某運營商TECS OpenStack使用主機overlay SDN方案組網(wǎng),運維人員在創(chuàng)建虛擬機測試虛擬機網(wǎng)絡狀態(tài)時發(fā)現(xiàn)問題:在其中一臺主機上創(chuàng)建兩臺同網(wǎng)段虛擬機,虛擬機之間二層地址無法Ping通,但是可以Ping通網(wǎng)關地址,如圖1所示。
    的頭像 發(fā)表于 06-12 09:28 ?670次閱讀
    <b class='flag-5'>TECS</b> OpenStack<b class='flag-5'>資源</b>池虛擬機<b class='flag-5'>網(wǎng)絡</b>二層地址無法互通的問題<b class='flag-5'>處理</b>

    曙光網(wǎng)絡發(fā)布網(wǎng)絡流量回溯分析平臺SUNA

    AI時代,日益復雜的網(wǎng)絡環(huán)境正給運維帶來嚴峻挑戰(zhàn)。業(yè)務系統(tǒng)卡頓、異常流量難溯源、故障定位如大海撈針等問題頻發(fā),傳統(tǒng)運維手段已難應對海量數(shù)據(jù)洪流的需求。
    的頭像 發(fā)表于 05-22 14:28 ?788次閱讀

    異常流量小區(qū)檢測功能介紹

    隨著5G部署規(guī)模不斷擴大,網(wǎng)管KPI的分析需求突增也日益顯著,存在用戶感知問題無法從告警和KPI數(shù)值中直接體現(xiàn)的情況;或者某些小區(qū)存在故障而網(wǎng)絡維護工程師無法及時監(jiān)控識別出來。異常流量
    的頭像 發(fā)表于 03-22 09:54 ?801次閱讀
    <b class='flag-5'>異常</b>零<b class='flag-5'>流量</b>小區(qū)檢測功能介紹

    TECS OpenStack資源池主機磁盤分區(qū)使用率過高的問題處理

    某運營商TECS資源池上報“主機磁盤分區(qū)使用率過高”的告警,如下圖所示。
    的頭像 發(fā)表于 03-21 09:47 ?812次閱讀
    <b class='flag-5'>TECS</b> OpenStack<b class='flag-5'>資源</b>池主機磁盤分區(qū)使用率過高的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源池虛機寫磁盤時延高告警的問題處理

    某運營商TECS資源池,在當前告警中顯示“虛機寫磁盤時延高告警”,如下圖所示。告警統(tǒng)計總體平均10分鐘左右自動恢復。
    的頭像 發(fā)表于 03-21 09:36 ?795次閱讀
    <b class='flag-5'>TECS</b> OpenStack<b class='flag-5'>資源</b>池虛機寫磁盤時延高<b class='flag-5'>告警</b>的問題<b class='flag-5'>處理</b>

    高效流量復制匯聚,構建自主可控的網(wǎng)絡安全環(huán)境

    隨著大數(shù)據(jù)監(jiān)測、流量分析以及網(wǎng)絡安全監(jiān)管等核心業(yè)務需求的日益增長,網(wǎng)絡環(huán)境對高性能、高可靠性的流量監(jiān)控和分析提出了更高的要求。流量復制匯聚平
    的頭像 發(fā)表于 03-10 14:29 ?764次閱讀
    高效<b class='flag-5'>流量</b>復制匯聚,構建自主可控的<b class='flag-5'>網(wǎng)絡</b>安全環(huán)境

    TECS OpenStack資源池時間同步失敗的故障分析

    某運營商TECS OpenStack資源池,在當前告警中顯示“時鐘同步失敗”,以10分鐘整數(shù)倍為間隔上報“時間同步失敗”告警,持續(xù)時間30秒
    的頭像 發(fā)表于 03-03 10:09 ?824次閱讀
    <b class='flag-5'>TECS</b> OpenStack<b class='flag-5'>資源</b>池時間同步失敗的故障分析

    TECS OpenStack資源池虛機殘留導致網(wǎng)元異常的問題處理

    某運營商TECS資源池的一臺主機內(nèi)存故障,進行關機、內(nèi)存更換操作,虛機自動遷移到其他主機上,同時做了其他虛擬機的手動遷移操作。后續(xù)在TECS上出現(xiàn)虛機內(nèi)核異常
    的頭像 發(fā)表于 03-03 09:42 ?674次閱讀
    <b class='flag-5'>TECS</b> OpenStack<b class='flag-5'>資源</b>池虛機殘留導致網(wǎng)元<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

    排查并處理共享站點S1用戶面路徑不可用告警

    增多,如圖1所示。 圖 1? 電信4G基站告警 1. 通過對基站告警進行分析后發(fā)現(xiàn),出現(xiàn)告警的S1用戶面路徑不可用告警,對端IP地址為10.100.33.X,如圖2所示。 圖2 對端I
    的頭像 發(fā)表于 01-23 11:08 ?1316次閱讀
    排查并<b class='flag-5'>處理</b>共享站點S1用戶面路徑不可用<b class='flag-5'>告警</b>

    交換機MC-LAG場景下單臂BFD無法UP問題

    作為源IP地址做BFD,VEG上配置靜態(tài)路由打通loopback連通性(注:直連地址在MC-LAG場景只有一邊互通)。 版本:9900X V1.00.20.02P16 ? 圖1?MC-LAG單臂BFD場景組網(wǎng)示意圖 單臂BFD
    的頭像 發(fā)表于 01-17 11:43 ?1225次閱讀
    交換機MC-LAG場景下單臂<b class='flag-5'>BFD</b>無法UP問題

    網(wǎng)絡流量監(jiān)控與網(wǎng)關優(yōu)化

    在當今數(shù)字化時代,網(wǎng)絡流量的監(jiān)控和管理對于任何組織來說都是至關重要的。隨著數(shù)據(jù)量的激增和網(wǎng)絡攻擊的日益復雜,有效的網(wǎng)絡流量監(jiān)控和網(wǎng)關優(yōu)化變得尤為重要。 網(wǎng)絡流量監(jiān)控的重要性 1. 識別
    的頭像 發(fā)表于 01-02 16:14 ?988次閱讀