倒計(jì)時1天!
2023華為金融網(wǎng)絡(luò)創(chuàng)新峰會
邀您相聚云南,共話金融數(shù)字化
凝新聚智 網(wǎng)行天下!
隨著金融科技發(fā)展和數(shù)字化轉(zhuǎn)型深化,線上業(yè)務(wù)、移動銀行等業(yè)務(wù)飛速發(fā)展,帶動數(shù)據(jù)中心網(wǎng)絡(luò)規(guī)模和流量飛速增長,網(wǎng)絡(luò)運(yùn)維和網(wǎng)絡(luò)安全保障的復(fù)雜度與難度也日益提高。同時金融業(yè)務(wù)連續(xù)性要求7*24小時不中斷,金融賬務(wù)、交易等可回溯性要求高,也要求數(shù)據(jù)中心運(yùn)維更加智能和高效。為此中國農(nóng)業(yè)銀行(簡稱“農(nóng)行”)在ABC ONE+網(wǎng)絡(luò)新三年規(guī)劃的指導(dǎo)下,全面開啟業(yè)務(wù)網(wǎng)絡(luò)一體化智能運(yùn)維的研究探索,并率先通過流量回溯與分析系統(tǒng)的創(chuàng)新和優(yōu)化,突破性實(shí)現(xiàn)網(wǎng)絡(luò)端到端流量采集、業(yè)務(wù)路徑還原和實(shí)時智能分析,為金融科技發(fā)展和數(shù)字化轉(zhuǎn)型保駕護(hù)航。
金融數(shù)字化轉(zhuǎn)型背景下的
運(yùn)維趨勢與挑戰(zhàn)
互聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)的發(fā)展促使數(shù)據(jù)中心的基礎(chǔ)架構(gòu)和管理對象正在發(fā)生天翻地覆的變化。一方面基礎(chǔ)架構(gòu)改變,云化和服務(wù)器資源池化驅(qū)動網(wǎng)絡(luò)虛擬化發(fā)展,多云多地多數(shù)據(jù)中心成為諸多大行和股份制銀行的選擇。數(shù)據(jù)中心流量飛速增長,并從傳統(tǒng)“南北向流量為主”向“東西向流量為主”轉(zhuǎn)變,數(shù)據(jù)中心運(yùn)維的規(guī)模和復(fù)雜度日益提升。另一方面管理對象改變,數(shù)據(jù)中心從傳統(tǒng)的集中式大小機(jī)逐步轉(zhuǎn)向分布式架構(gòu),運(yùn)維和管理的對象也從“傳統(tǒng)的主機(jī)、設(shè)備等物理硬件”轉(zhuǎn)向“應(yīng)用、服務(wù)等軟件資源和數(shù)據(jù)”,數(shù)據(jù)中心運(yùn)維的管理范圍和要求逐步提高。
在這種背景下,IT運(yùn)維工具層出不窮,百花齊放。從傳統(tǒng)手動運(yùn)維的“農(nóng)耕時代”,到自動化運(yùn)維的“工業(yè)時代”,再到智能運(yùn)維的“智能時代”,運(yùn)維技術(shù)在近幾年實(shí)現(xiàn)了跨越式發(fā)展。然而在金融行業(yè)實(shí)際的管理和運(yùn)維中,因?yàn)槿狈\(yùn)維系統(tǒng)的統(tǒng)一規(guī)劃,在面對時好時壞的業(yè)務(wù)體驗(yàn)質(zhì)量、復(fù)雜的應(yīng)用遷移和上線策略,以及海量的日志告警,數(shù)據(jù)中心運(yùn)維逐步暴露出一些問題,例如:

傳統(tǒng)網(wǎng)絡(luò)流量采集大多在物理設(shè)備旁路流量鏡像方式實(shí)現(xiàn),無法向下打開虛擬網(wǎng)絡(luò)邊界,造成網(wǎng)絡(luò)監(jiān)測盲點(diǎn);而網(wǎng)絡(luò)運(yùn)維工具更關(guān)心網(wǎng)絡(luò)自身的狀態(tài),無法向上看到業(yè)務(wù)的整體性能,即便網(wǎng)絡(luò)感知到故障也無法判斷業(yè)務(wù)影響范圍。因此在實(shí)現(xiàn)業(yè)務(wù)互訪關(guān)系映射,以及實(shí)現(xiàn)Overlay網(wǎng)絡(luò)與Underlay網(wǎng)絡(luò)映射之后,如何實(shí)現(xiàn)業(yè)務(wù)狀態(tài)與網(wǎng)絡(luò)狀態(tài)的映射成為下一步業(yè)務(wù)與網(wǎng)絡(luò)可視化的難點(diǎn)。

一個數(shù)據(jù)中心可能會出現(xiàn)十多個不同的業(yè)務(wù)和網(wǎng)絡(luò)管理系統(tǒng),彼此之間猶如楚河漢界各自管理,并存在流量重復(fù)采集,以及信息不能有效聯(lián)動的問題。只有在收到故障告警需要聯(lián)合定位時,再進(jìn)行人工協(xié)同判定問題出現(xiàn)的位置和原因,往往耗費(fèi)數(shù)天,故障定界定位周期長、效率低。

隨著數(shù)據(jù)中心分布式架構(gòu)變化,現(xiàn)網(wǎng)因分布式“多打一”造成的微突發(fā)、丟包等質(zhì)差問題層出不窮。此類問題在業(yè)務(wù)層面僅能感知到卡頓或者性能下降,在網(wǎng)絡(luò)層面因?yàn)槿鄙傧到y(tǒng)性的數(shù)據(jù)分析和評估,難以主動察覺和復(fù)現(xiàn),事后排障也沒任何依據(jù),只能手工檢查表項(xiàng)/告警等信息,耗時長且對技術(shù)要求高。因此網(wǎng)絡(luò)部門只能配合業(yè)務(wù)部門反復(fù)進(jìn)行定位和分析,對網(wǎng)絡(luò)隱患系統(tǒng)性排查和提前識別提出了更高的要求。
因此,如何打破不同管理系統(tǒng)的責(zé)任邊界和管理范圍的桎梏,又不影響現(xiàn)網(wǎng)已有運(yùn)維系統(tǒng),是目前金融行業(yè)面臨的普遍的困難和挑戰(zhàn)?;诖耍r(nóng)行堅(jiān)定地開啟了業(yè)務(wù)網(wǎng)絡(luò)一體化智能運(yùn)維的新探索,并明確將全網(wǎng)端到端智能運(yùn)維作為數(shù)據(jù)中心運(yùn)維發(fā)展的路標(biāo)和方向。
跨越式演進(jìn)
農(nóng)行首次打破業(yè)務(wù)與網(wǎng)絡(luò)運(yùn)維邊界
2022年,為了打破業(yè)務(wù)與網(wǎng)絡(luò)的邊界,農(nóng)行啟動業(yè)務(wù)網(wǎng)絡(luò)一體化智能運(yùn)維探索。一方面主動梳理并摸排全行的運(yùn)維痛點(diǎn)和問題,另一方面積極和華為等廠家交流,探索業(yè)界最新的技術(shù)和運(yùn)維方向,吸取各家所長。最終,農(nóng)行流量回溯分析系統(tǒng)由業(yè)務(wù)性能管理系統(tǒng)和網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)兩部分構(gòu)成,并在該邏輯架構(gòu)基礎(chǔ)上進(jìn)行了如下創(chuàng)新實(shí)踐。

網(wǎng)絡(luò)運(yùn)維能力服務(wù)化,狀態(tài)主動上送。為了快速向業(yè)務(wù)性能管理系統(tǒng)提供網(wǎng)絡(luò)數(shù)據(jù),網(wǎng)絡(luò)通過100+全量API實(shí)現(xiàn)服務(wù)化,并全面開放網(wǎng)絡(luò)數(shù)據(jù)服務(wù),通過拖拽式整合即可快速發(fā)布場景化API與上層業(yè)務(wù)性能管理系統(tǒng)對接,打破了傳統(tǒng)硬編碼開發(fā)的模式,大大縮短了系統(tǒng)間集成周期。

流量鏡像疊加,端到端路徑還原。為了對業(yè)務(wù)進(jìn)行全面的質(zhì)量保障,實(shí)現(xiàn)全面流量鏡像,農(nóng)行在DC出口、Fabric出口、VAS設(shè)備互聯(lián)口等關(guān)鍵節(jié)點(diǎn)進(jìn)行邊界出口全流鏡像,并由業(yè)務(wù)性能管理系統(tǒng)進(jìn)行會話與網(wǎng)絡(luò)性能分析;在Fabric內(nèi)部基于TCP特征報文進(jìn)行ERSPAN流鏡像,并上送給網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)還原Fabric內(nèi)轉(zhuǎn)發(fā)路徑。最后通過兩種流量鏡像疊加,實(shí)現(xiàn)了端到端鏡像和路徑還原,并支持鏡像流量的去重、解密和脫敏等,減輕分析段壓力。

AI智能分析與推理,網(wǎng)絡(luò)風(fēng)險智能評估。為了實(shí)現(xiàn)全量風(fēng)險評估,網(wǎng)絡(luò)通過采集設(shè)備的ERSPAN流、Telemetry性能Metrics進(jìn)行大數(shù)據(jù)分析,并結(jié)合AI算法主動感知網(wǎng)絡(luò)可能存在的故障,智能分析識別是否存在網(wǎng)絡(luò)或者應(yīng)用的群體性故障,逐步實(shí)現(xiàn)故障主動感知、分鐘級故障定位定界的主動智能運(yùn)維目標(biāo)。
分鐘級根因分析
邁出端到端智能運(yùn)維第一步
通過如上探索,農(nóng)行流量回溯分析系統(tǒng)實(shí)現(xiàn)了“業(yè)務(wù)質(zhì)量分析→網(wǎng)絡(luò)會話分析→網(wǎng)絡(luò)路徑分析→故障根因定位”的端到端立體化運(yùn)維,能夠提供覆蓋Underlay與Overlay的業(yè)務(wù)和網(wǎng)絡(luò)性能分析能力;打通業(yè)務(wù)、會話、網(wǎng)絡(luò)問題分析路徑,快速發(fā)現(xiàn)并定位質(zhì)差問題;同時滿足問題定界、全網(wǎng)路徑分析、質(zhì)差主動感知等具體分析場景。最終達(dá)到了如下效果:

農(nóng)行流量回溯與分析系統(tǒng)支持對220+金融業(yè)務(wù)性能指標(biāo),包括交易量、交易成功率、交易時延等業(yè)務(wù)層指標(biāo)的實(shí)時分析,可主動感知交易質(zhì)量下降,一鍵追蹤全路徑交易并識別異常服務(wù)節(jié)點(diǎn)。

實(shí)時感知業(yè)務(wù)異常后,農(nóng)行流量回溯與分析系統(tǒng)支持將業(yè)務(wù)交易的全服務(wù)路徑與業(yè)務(wù)流的網(wǎng)絡(luò)轉(zhuǎn)發(fā)路況進(jìn)行一鍵關(guān)聯(lián),發(fā)現(xiàn)異常后可以跳轉(zhuǎn)到網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)進(jìn)行聯(lián)合分析,打通業(yè)務(wù)-會話-網(wǎng)絡(luò)E2E分析路徑,快速進(jìn)行責(zé)任定界。

網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)采用規(guī)則引擎、智能化引擎、知識圖譜等技術(shù)進(jìn)行大數(shù)據(jù)挖掘分析,對全網(wǎng)基礎(chǔ)資源統(tǒng)一建模,將網(wǎng)絡(luò)對象、事件、傳播關(guān)系進(jìn)行聯(lián)合分析,推理網(wǎng)絡(luò)故障根因,實(shí)現(xiàn)對故障的分鐘級根因分析。同時通過AI算法將多個網(wǎng)絡(luò)指標(biāo)進(jìn)行關(guān)聯(lián),提前識別網(wǎng)絡(luò)中可靠性、容量、性能、穩(wěn)定性等隱患,統(tǒng)一評估全網(wǎng)潛在風(fēng)險,由被動救火向主動運(yùn)維轉(zhuǎn)變,降低故障發(fā)生概率。
農(nóng)行流量回溯分析系統(tǒng)的創(chuàng)新實(shí)現(xiàn)了端到端智能運(yùn)維的新突破,讓業(yè)務(wù)與網(wǎng)絡(luò)不再割裂,實(shí)現(xiàn)了業(yè)務(wù)和網(wǎng)絡(luò)運(yùn)維數(shù)據(jù)的融合。未來,農(nóng)行端到端智能運(yùn)維將進(jìn)一步從物理網(wǎng)絡(luò)、虛擬網(wǎng)絡(luò)向全棧云網(wǎng)絡(luò)演進(jìn),并進(jìn)一步打通數(shù)據(jù)中心內(nèi)、數(shù)據(jù)中心間,以及分支互聯(lián)的運(yùn)維通道,實(shí)現(xiàn)全局全網(wǎng)一體化運(yùn)維,提升整網(wǎng)運(yùn)維管理效率和業(yè)務(wù)連續(xù)性水平,保障農(nóng)行數(shù)字化轉(zhuǎn)型邁向新篇章。

原文標(biāo)題:2023華為金融網(wǎng)絡(luò)創(chuàng)新峰會 | 農(nóng)行網(wǎng)絡(luò)流量回溯與分析實(shí)現(xiàn)新突破,探索端到端運(yùn)維新模式
文章出處:【微信公眾號:華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
華為
+關(guān)注
關(guān)注
216文章
35212瀏覽量
255911
原文標(biāo)題:2023華為金融網(wǎng)絡(luò)創(chuàng)新峰會 | 農(nóng)行網(wǎng)絡(luò)流量回溯與分析實(shí)現(xiàn)新突破,探索端到端運(yùn)維新模式
文章出處:【微信號:Huawei_Fixed,微信公眾號:華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代
華為品智聯(lián)接數(shù)據(jù)通信商業(yè)市場創(chuàng)新峰會圓滿落幕
華為AI大模型助力金融行業(yè)智能化轉(zhuǎn)型
2025華為數(shù)據(jù)通信創(chuàng)新峰會香港站圓滿收官
華為星河AI金融網(wǎng)絡(luò)全新升級
曙光網(wǎng)絡(luò)發(fā)布網(wǎng)絡(luò)流量回溯分析平臺SUNA
廣東移動聯(lián)合華為推出SPN網(wǎng)絡(luò)運(yùn)維故障智能體方案
華為數(shù)據(jù)通信創(chuàng)新峰會2025成功舉辦
中興通訊推出基于AI驅(qū)動的全新端到端網(wǎng)絡(luò)解決方案
網(wǎng)絡(luò)流量監(jiān)控與網(wǎng)關(guān)優(yōu)化
端到端InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

評論