近日,中國電信股份有限公司研究院在未來網(wǎng)絡(luò)大會上推出了《算力城域網(wǎng)白皮書(2025)》,進一步明確了城域網(wǎng)絡(luò)在面向算力業(yè)務(wù)新場景、新需求下需具備的網(wǎng)絡(luò)架構(gòu)和關(guān)鍵網(wǎng)絡(luò)能力。本次印發(fā)的《算力城域網(wǎng)白皮書(2025)》對算力城域網(wǎng)應(yīng)用場景、網(wǎng)絡(luò)架構(gòu)、組網(wǎng)方案和技術(shù)展開探討,目的是積極推動算力城域網(wǎng)的相關(guān)技術(shù)研發(fā)和現(xiàn)網(wǎng)驗證,最終通過該白皮書的發(fā)布匯聚行業(yè)力量,共同打造廣覆蓋、高彈性、超高可靠、智能化的算力城域網(wǎng)絡(luò)。為此,特對此白皮書進行詳細解讀。
什么是算力城域網(wǎng)
隨著人工智能等技術(shù)的快速發(fā)展和廣泛應(yīng)用,算力需求呈現(xiàn)爆炸式增長,中國電信積極布局算力基礎(chǔ)設(shè)施,向政府、企業(yè)、科研機構(gòu)提供就近的高效算力服務(wù)。面對企業(yè)用戶使用算力時遇到的海量數(shù)據(jù)傳輸難,敏感數(shù)據(jù)安全保障難以及算力協(xié)同調(diào)度難等問題,電信研究院定義算力城域網(wǎng)以新型城域網(wǎng)絡(luò)架構(gòu)為基礎(chǔ),通過Spine-Leaf的Full-Mesh組網(wǎng)優(yōu)勢實現(xiàn)東西向南北向流量的無阻塞快速轉(zhuǎn)發(fā),構(gòu)建智算中心與企業(yè)用戶之間的安全高速通道。通過引入算力靈活調(diào)度、算力無損傳輸、精準流級調(diào)度、網(wǎng)絡(luò)智能運營等能力,滿足用算企業(yè)行業(yè)數(shù)據(jù)安全不出域、算力靈活擴展、海量數(shù)據(jù)快速傳輸?shù)汝P(guān)鍵訴求,面向千行百業(yè)提供高效、高安全、高性價比的算網(wǎng)一體服務(wù)。
算力城域網(wǎng)關(guān)鍵網(wǎng)絡(luò)需求:
網(wǎng)絡(luò)彈性高吞吐,拉遠訓推算效不下降
大模型訓練推理數(shù)據(jù)量龐大,而且數(shù)據(jù)產(chǎn)生和訓練不在一個地點,TB/PB級的大數(shù)據(jù)傳送效率低是目前運營商網(wǎng)絡(luò)最需要解決的緊迫問題。企業(yè)普遍面臨周期性數(shù)據(jù)傳輸帶來的帶寬配置難題:長期采用高帶寬專線會導致閑置期資源浪費,而低帶寬專線則因傳輸時延過長造成算力資源空轉(zhuǎn)。另外在智算、超算等場景中常常存在大量的大象流,這類流量具有單流瞬時高速率(10M至100G)的特征。傳統(tǒng)基于五元組哈希的負載均衡技術(shù)難以有效應(yīng)對大象流,容易造成負載不均衡和網(wǎng)絡(luò)擁塞。因此,算力城域網(wǎng)一方面需要具備網(wǎng)絡(luò)級負載均衡能力,全面提升整網(wǎng)的有效吞吐量;另一方面網(wǎng)絡(luò)需要具備高度的彈性與敏捷性,根據(jù)企業(yè)算力業(yè)務(wù)需求動態(tài)調(diào)度算力業(yè)務(wù)流的網(wǎng)絡(luò)路徑和專線帶寬,提供持續(xù)穩(wěn)定的數(shù)據(jù)傳輸服務(wù)。
為了提升智算數(shù)據(jù)傳輸效率,智算業(yè)務(wù)傳輸協(xié)議逐漸從TCP向RDMA協(xié)議發(fā)展。RDMA協(xié)議對網(wǎng)絡(luò)丟包十分敏感度,千分之一丟包導致模型訓練速率下降50%。對于存算分離拉遠訓練、跨集群協(xié)同訓練以及云邊協(xié)同訓推等場景,樣本面和參數(shù)面的數(shù)據(jù)傳輸從AIDC內(nèi)延伸到AIDC之間,傳輸距離可達上百公里,廣域網(wǎng)絡(luò)的流量擁塞和鏈路故障不可避免,從而加大了智算數(shù)據(jù)丟失的概率并影響模型訓練效率。所以算力城域網(wǎng)需要具備企業(yè)用戶到智算中心之間長距RDMA數(shù)據(jù)高效可靠的傳輸能力,保障模型拉遠訓推效率下降不超過5%。
華為AI WAN高算效廣域關(guān)鍵技術(shù)
突破傳統(tǒng)網(wǎng)絡(luò)技術(shù)瓶頸
華為AI WAN高算效廣域方案通過SPFC精準流控、AFR流級調(diào)度以及RDMA雙發(fā)選收等關(guān)鍵技術(shù)應(yīng)對算力服務(wù)由數(shù)據(jù)中心機房向廣域網(wǎng)延伸所帶來的網(wǎng)絡(luò)承載挑戰(zhàn)。
RDMA數(shù)據(jù)長距高可靠傳輸:當網(wǎng)絡(luò)中發(fā)生擁塞,算力城域網(wǎng)的網(wǎng)絡(luò)設(shè)備以租戶級業(yè)務(wù)為粒度對擁塞報文進行緩存,緩存超過水線時,以租戶為粒度向上一跳網(wǎng)絡(luò)設(shè)備發(fā)送反壓信號直至流量發(fā)送節(jié)點,保障租戶級的網(wǎng)絡(luò)擁塞不丟包,實現(xiàn)了超百公里RDMA高可靠傳輸。精準流控技術(shù)實現(xiàn)了租戶級擁塞控制隔離,解決傳統(tǒng)PFC技術(shù)在廣域網(wǎng)易引發(fā)頭阻和擁塞擴散導致租戶間相互影響的難題,為大規(guī)模分布式訓推提供技術(shù)底座。另一方面,AI WAN高算效廣域方案支持雙發(fā)選收的技術(shù),即發(fā)送側(cè)同時發(fā)送兩份相同數(shù)據(jù),通過不同路徑送到接收端。接收端收到兩份數(shù)據(jù)后,通過芯片級技術(shù)實現(xiàn)Tbps級高速報文選收重排序,降低長距傳輸因光纖故障或誤碼導致數(shù)據(jù)丟包的概率。經(jīng)現(xiàn)網(wǎng)實驗局以及信通院測試機構(gòu)驗證精準流控以及RDMA雙發(fā)選收的技術(shù)可以支撐智算拉遠訓練效率達97%以上。
大象流精準識別,網(wǎng)絡(luò)級負載均衡:智算業(yè)務(wù)存在大量大象流與老鼠流,算力城域網(wǎng)部署精準流識別技術(shù)識別大象流,流級自適應(yīng)調(diào)度算法基于網(wǎng)絡(luò)實時狀態(tài)對大象流轉(zhuǎn)發(fā)路徑進行流級調(diào)度,實現(xiàn)全局負載均衡,網(wǎng)絡(luò)吞吐可達90%以上。流級自適應(yīng)調(diào)度技術(shù)解決了傳統(tǒng)廣域網(wǎng)絡(luò)中ECMP算法由于無法感知流大小,導致大象流、老鼠流哈希不均,造成鏈路忙閑不均,鏈路吞吐低的問題。
總結(jié)與展望
算力白皮書強調(diào)算力城域網(wǎng)是云化IP城域網(wǎng)面向算力新業(yè)態(tài)的演進,本質(zhì)上是通過“資源協(xié)同化、服務(wù)普惠化、技術(shù)生態(tài)化”,解決智算業(yè)務(wù)發(fā)展中的效率和成本問題。算力城域網(wǎng)不僅是支撐AI大模型、智慧產(chǎn)業(yè)等應(yīng)用落地的“基礎(chǔ)設(shè)施”,更是推動我國從“算力大國”向“智算強國”跨越的“核心引擎”。
當前中國電信聯(lián)合華為基于AI WAN高算效算力網(wǎng)的關(guān)鍵技術(shù)在上海、浙江、廣東等地圍繞海量數(shù)據(jù)彈性高效入算、存算分離百公里拉遠訓練、百公里分布式推理等新型智算業(yè)務(wù)現(xiàn)網(wǎng)的驗證,開啟算力城域網(wǎng)的新協(xié)議、新技術(shù)探索。
-
華為
+關(guān)注
關(guān)注
216文章
35572瀏覽量
259209 -
AI
+關(guān)注
關(guān)注
88文章
36973瀏覽量
289790 -
算力
+關(guān)注
關(guān)注
2文章
1322瀏覽量
16383
原文標題:AI WAN | 《算力城域網(wǎng)白皮書(2025)》解讀:華為AI WAN助力算力城域網(wǎng)開啟新征程
文章出處:【微信號:Huawei_Fixed,微信公眾號:華為數(shù)據(jù)通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
華為AI WAN解決方案使能算網(wǎng)一體化新服務(wù)
中國電信聯(lián)合華為發(fā)布邊云協(xié)同算網(wǎng)解決方案
華為AI WAN解決方案加速運營商承載網(wǎng)價值變現(xiàn)
華為AI WAN解決方案加速全產(chǎn)業(yè)智能化升級
華為助力算力互聯(lián)網(wǎng)跨域算間無損互聯(lián)
華為AI WAN智算IP廣域網(wǎng)助力算力互聯(lián)網(wǎng)建設(shè)
華為推出面向AI WAN的智算IP廣域網(wǎng)解決方案
面向AI WAN的華為解決方案釋放算網(wǎng)潛能 使能差異化服務(wù)

華為受邀出席2025云網(wǎng)智聯(lián)大會
華為SPN技術(shù)助力算力網(wǎng)絡(luò)和數(shù)聯(lián)網(wǎng)發(fā)展
華為AI WAN在智算邊緣推理網(wǎng)絡(luò)中的關(guān)鍵優(yōu)勢
華為星河AI廣域網(wǎng)助力行業(yè)數(shù)智化
華為發(fā)布AI WAN解決方案

評論