曰本美女∴一区二区特级A级黄色大片, 国产亚洲精品美女久久久久久2025, 页岩实心砖-高密市宏伟建材有限公司, 午夜小视频在线观看欧美日韩手机在线,国产人妻奶水一区二区,国产玉足,妺妺窝人体色WWW网站孕妇,色综合天天综合网中文伊,成人在线麻豆网观看

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TECS OpenStack資源池虛機殘留導致網元異常的問題處理

中興文檔 ? 來源:中興文檔 ? 2025-03-03 09:42 ? 次閱讀

故障現象

某運營商TECS資源池的一臺主機內存故障,進行關機、內存更換操作,虛機自動遷移到其他主機上,同時做了其他虛擬機的手動遷移操作。后續(xù)在TECS上出現虛機內核異常告警,如下圖所示。

942c8290-f40f-11ef-9310-92fbcf53809c.png

故障分析

1. 檢查告警,確認是一臺虛擬機的多次告警,如下圖所示。

944e21ac-f40f-11ef-9310-92fbcf53809c.png

2. 經排查,服務器SRV-09有內存更換和下電操作,00:39 虛機全部自動遷移成功,其中包含了XXX0012虛機,同時還包括其他網元的虛機,其他網元未出現異常。

3. 現場進行虛機重啟、遷移等操作,未成功恢復XXX00012虛機。分析虛機CPU都沖高到100%,虛機操作系統顯示軟鎖,如下圖所示。

9485e0b0-f40f-11ef-9310-92fbcf53809c.png

4. 經操作系統分析,是有大量外部報文沖擊導致CPU沖高到100%,系統得不到調度。

5. 將該網元中除XXX00012外的其他虛機都shutdown后,再重啟XXX00012虛機,XXX00012虛擬機恢復正常。

6. 逐一開啟其他虛機,發(fā)現XXX00012虛機異常,其余虛機均正常啟動。3分鐘后XXX00012虛機CPU再次沖高到100%。

7. 分析XXX00012虛機,發(fā)現該虛機存在I/O Error,數據盤不能正常讀寫,如下圖所示。

94916b24-f40f-11ef-9310-92fbcf53809c.png

8. 分析虛機殘留問題,原主機SRV-09故障下電后,虛機自動遷移,第一次自動遷移失敗,自動遷移落地的節(jié)點是SRV-10,如下圖所示。

94a8e088-f40f-11ef-9310-92fbcf53809c.png

9. SRV-10節(jié)點上因為帶寬資源不足落地失敗,XXX00012虛機重新自動遷移到SRV-12,自動遷移成功,如下圖所示。

94cc0842-f40f-11ef-9310-92fbcf53809c.png

10. 自動遷移異常導致虛機實例在SRV-10和SRV-12同時啟動,如下圖所示。

94f0ad00-f40f-11ef-9310-92fbcf53809c.png

11. 綜上分析,產生該問題的原因是殘留虛機,導致網元異常。

故障處理

1. 關閉SRV-12服務器上XXX0012虛機,同時刪除SRV-10服務器上該虛機殘留的實例。

2. 重啟XXX0012虛機,虛機啟動正常,CPU恢復正常。觀察半小時未再出現異常。

3. 總結:異地重生階段建議不要做其他互斥或者相同的操作,容易造成集群中數據不一致等問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 內核
    +關注

    關注

    3

    文章

    1405

    瀏覽量

    40999
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11015

    瀏覽量

    215400
  • 內存
    +關注

    關注

    8

    文章

    3103

    瀏覽量

    74916
  • 主機
    +關注

    關注

    0

    文章

    1030

    瀏覽量

    35762
  • 虛擬機
    +關注

    關注

    1

    文章

    958

    瀏覽量

    28920

原文標題:TECS OpenStack-資源池虛機殘留導致網元異常的問題處理

文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    RCS融合通信系統設計方案解析

    TECS主要由以下部分組成:OpenStack自身的組件,OpenStack部署相關組件,以及擴展的HA、自動部署與管理、系統管理(軟、硬件資源管理)等組件,
    發(fā)表于 07-01 15:45 ?3106次閱讀
    RCS融合通信系統設計方案解析

    OpenStack資源調度和現狀分析

    OpenStack云端的資源調度和優(yōu)化剖析2016-07-03 19:12 作者簡介:胡曉亮,目前就職于IBM Platform Computing 系統科技部云計算部門,擔任云計算開發(fā)部工程師。自
    發(fā)表于 10-10 10:44 ?0次下載
    <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b>調度和現狀分析

    電力云資源的建立

    國家電網公司從2010年開始建設電力云資源,存儲域作為資源的必須部分,設計和實現存儲域是資源
    發(fā)表于 11-27 17:33 ?0次下載
    電力云<b class='flag-5'>資源</b><b class='flag-5'>池</b>的建立

    OpenStack云平臺監(jiān)控數據采集及處理的實踐與優(yōu)化

    本文介紹了在OpenStack云平臺中通過Ceilometer采集云平臺中虛擬、磁盤、網絡等資源的使用數據,并通過Gnocchi處理、儲存和索引數據的實踐。
    的頭像 發(fā)表于 12-25 18:38 ?2179次閱讀

    線程池中如何獲取和處理異常

    在實際開發(fā)中,我們常常會用到線程,但任務一旦提交到線程之后,如果發(fā)生異常之后,怎么處理
    的頭像 發(fā)表于 10-24 15:44 ?1582次閱讀

    TECS資源池上報網絡流程異常告警的問題處理

    資源TECS上報網絡流程異常告警,告警單次持續(xù)15秒-4分鐘之間。
    的頭像 發(fā)表于 06-07 09:41 ?1154次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報網絡流程<b class='flag-5'>異常</b>告警的問題<b class='flag-5'>處理</b>

    TECS資源池上報存儲設備離線的問題處理

    資源在運行過程中出現存儲設備離線告警,通過底層cinder service-list命令查看,確認存儲state為down狀態(tài)。
    的頭像 發(fā)表于 06-07 09:44 ?835次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報存儲設備離線的問題<b class='flag-5'>處理</b>

    TECS資源SSH控制節(jié)點提示connection refused的問題處理

    某局點現場TECS控制節(jié)點的TECSClient平面使用雙棧配置,同時使用IPv4和IPv6。
    的頭像 發(fā)表于 06-07 09:47 ?966次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>SSH控制節(jié)點<b class='flag-5'>虛</b><b class='flag-5'>機</b>提示connection refused的問題<b class='flag-5'>處理</b>

    TECS資源池上報BFD會話DOWN和網絡流量異常告警的問題處理

    資源TECS上報BFD會話DOWN告警和網絡流量異常告警,持續(xù)時間1秒至6分鐘不等,如下圖所示。
    的頭像 發(fā)表于 06-07 09:49 ?1640次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報BFD會話DOWN和網絡流量<b class='flag-5'>異常</b>告警的問題<b class='flag-5'>處理</b>

    與網關不通的問題處理

    客戶反饋實例化過程中的網絡問題:第三方VNF實例化完成之后,從Ping網關發(fā)現有的口Ping不通
    的頭像 發(fā)表于 06-07 09:52 ?910次閱讀
    <b class='flag-5'>虛</b><b class='flag-5'>機</b>與網關不通的問題<b class='flag-5'>處理</b>

    資源后端存儲服務狀態(tài)異常的問題處理

    故障現象某資源在巡檢過程中檢查服務狀態(tài),其中云盤后端的服務狀態(tài)為down,如下圖所示,影響虛擬云盤的生命周期管理操作。
    的頭像 發(fā)表于 09-20 11:06 ?919次閱讀
    <b class='flag-5'>資源</b><b class='flag-5'>池</b>后端存儲服務狀態(tài)<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

    資源虛擬機時鐘跳變異常的問題處理

    資源在運行過程中一臺虛擬出現業(yè)務異常,通過查看日志和異常記錄,判斷為虛擬發(fā)生時鐘跳變問題
    的頭像 發(fā)表于 09-20 11:08 ?1693次閱讀
    <b class='flag-5'>資源</b><b class='flag-5'>池</b>虛擬機時鐘跳變<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源時間同步失敗的故障分析

    某運營商TECS OpenStack資源,在當前告警中顯示“時鐘同步失敗”,以10分鐘整數倍為間隔上報“時間同步失敗”告警,持續(xù)時間30秒-1分鐘不等。
    的頭像 發(fā)表于 03-03 10:09 ?302次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>時間同步失敗的故障分析

    TECS OpenStack資源寫磁盤時延高告警的問題處理

    某運營商TECS資源,在當前告警中顯示“寫磁盤時延高告警”,如下圖所示。告警統計總體平均10分鐘左右自動恢復。
    的頭像 發(fā)表于 03-21 09:36 ?291次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b><b class='flag-5'>虛</b><b class='flag-5'>機</b>寫磁盤時延高告警的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源主機磁盤分區(qū)使用率過高的問題處理

    某運營商TECS資源池上報“主機磁盤分區(qū)使用率過高”的告警,如下圖所示。
    的頭像 發(fā)表于 03-21 09:47 ?315次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>主機磁盤分區(qū)使用率過高的問題<b class='flag-5'>處理</b>