故障現(xiàn)象
某運營商反饋在定制網(wǎng)業(yè)務中,UPF為BM CAAS形態(tài),UPF業(yè)務交換機為MCLAG組網(wǎng)。業(yè)務配置完成不久后出現(xiàn)兩個告警:
1. UPF Rosng協(xié)議棧xgei-2/0/4/2.7頻繁出現(xiàn)BFD會話閃斷現(xiàn)象。
2. 第二臺UPF業(yè)務交換機的BGP Loopback地址(192.168.100.18/FD00100:: 18)到UPF Rosng協(xié)議棧的BGP出現(xiàn)閃斷。
因此需要排查原因。
故障分析
面對此類問題,需要從故障現(xiàn)象中歸納總結幾個關鍵點:
一、由“業(yè)務配置完成后不久出現(xiàn)兩個告警”可以得出,告警大概率與現(xiàn)場新加的定制網(wǎng)業(yè)務配置有強相關。
二、出現(xiàn)的告警為Rosng與UPF業(yè)務交換機,可進一步縮小定界范圍。
因此排查過程如下:
1. 分析UPF告警:通過EM告警采集,可以看到存在“BFD會話down”告警,且告警特征為告警發(fā)生頻繁、可自動恢復,Rosng端口為xgei-2/0/X/2.7,如下圖所示。
2. 此外,還存在“BGP鄰居down”告警,告警可自動恢復,故障IP=192.168.100.18,如下圖所示。
3. 根據(jù)以上告警信息檢查UPF網(wǎng)元業(yè)務配置,發(fā)現(xiàn)IP=192.168.100.18地址為UPF的N6側BGP鄰居地址(鄰居為業(yè)務交換機),如下圖所示。
4. UPF告警所在的Rosng端口均為VPN為yghjb的端口,此VPN也是本次定制網(wǎng)新添加配置。VLAN ID為1061,VLAN網(wǎng)關在UPF業(yè)務交換機,因此在Rosng進行Ping測試,目的IP為VLAN1061網(wǎng)關,源地址取Rosng邏輯接口地址(192.168.30.1~4)。但Ping測試結果顯示均能Ping通(告警同時未復現(xiàn));Rosng和交換機側VLAN1061相關的ND6 Cache結果均為正常,如下圖所示。
5. 檢查兩臺UPF業(yè)務交換機配置,發(fā)現(xiàn)兩臺業(yè)務交換機未配置anycast mac地址,如下圖所示。
6. 在交換機為MCLAG組網(wǎng)中,若VLAN網(wǎng)關的anycast mac不配置,將會導致NA單播報文無法命中三層mac,NA上送失敗后,交換機的MAC地址學習異常。
當Rosng模塊接口IP無法學習到VLAN1061網(wǎng)關時,將導致VLAN1061鏈路不通,而VLAN1061鏈路不通將會使Rosng所有以VLAN1061為BFD檢測的路由進行失效處理,配置如下圖所示。
當此默認路由失效使,Rosng與業(yè)務交換機的BGP鄰居則不通,這也解釋了產(chǎn)生“BGP鄰居down”告警的原因。
故障處理
1. 在UPF兩臺業(yè)務交換機的VLAN1061網(wǎng)關,執(zhí)行如下命令:
interface mac-address 0000.5e00.2101 anycast
2. 命令執(zhí)行成功后,BFD會話down的閃斷告警便不再出現(xiàn),問題解決。
-
運營商
+關注
關注
4文章
2425瀏覽量
46040 -
交換機
+關注
關注
23文章
2842瀏覽量
103306 -
UPF
+關注
關注
0文章
51瀏覽量
14049
原文標題:ZXUN xGW-邊緣UPF BGP閃斷的問題處理
文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
bgp配置實例講解 如何配置Cilium和BGP協(xié)同工作

動態(tài)BGP與靜態(tài)BGP的區(qū)別?
什么是UPF呢?
UPF流程與電源域Power Domain詳解
動態(tài)BGP與靜態(tài)BGP的區(qū)別
ZXUN xGW-ToB業(yè)務延遲的問題處理
什么是低功耗設計呢(UPF編碼篇)

ZXUN xGW-UPF雙域容災局點互轉隧道異常的問題處理方法

ZXUN xGW會話數(shù)不均衡的故障分析

ZXUN xGW安全加固后與R50s網(wǎng)管斷鏈的故障分析

評論