CCF Chip 2024,精彩不能停!7月21日下午,中科馭數(shù)在第二屆中國計(jì)算機(jī)學(xué)會(CCF)芯片大會的“馭數(shù)專屬時(shí)刻”仍在繼續(xù),馭數(shù)組織承辦“DPU技術(shù)趨勢和應(yīng)用——DPU在云原生與智算網(wǎng)絡(luò)中的探索與實(shí)踐”專題論壇,業(yè)內(nèi)DPU專家們將討論焦點(diǎn)鎖定在了DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實(shí)際應(yīng)用,深入探討了如何利用DPU技術(shù)解決計(jì)算系統(tǒng)級問題,進(jìn)一步推動(dòng)了DPU技術(shù)與產(chǎn)業(yè)應(yīng)用的深度融合。
論壇主席中科院計(jì)算所研究員李曉維在開場致辭中表示,DPU在網(wǎng)絡(luò)、計(jì)算、安全、數(shù)據(jù)中心智能化等方面展現(xiàn)了關(guān)鍵作用,可以滿足國家建設(shè)新質(zhì)生產(chǎn)力的需求。李老師指出,在國家戰(zhàn)略和產(chǎn)業(yè)發(fā)展雙重需求的驅(qū)動(dòng)下,DPU正迎來發(fā)展的黃金時(shí)期,需深化產(chǎn)學(xué)研合作,共同把握機(jī)遇,應(yīng)對挑戰(zhàn),加速推進(jìn)DPU產(chǎn)業(yè)化進(jìn)程。
論壇主席、中科馭數(shù)高級副總裁、CTO盧文巖表示,中科馭數(shù)長期致力于推動(dòng)DPU技術(shù)的創(chuàng)新與發(fā)展,過去四年來,我們已連續(xù)舉辦了五屆DPU技術(shù)論壇,從最初的底層芯片技術(shù)探討,到軟件生態(tài)的構(gòu)建,再到上層應(yīng)用的拓展,論壇主題層層遞進(jìn),穩(wěn)扎穩(wěn)打,希望推動(dòng)產(chǎn)業(yè)界構(gòu)建探討一套全面、堅(jiān)實(shí)、領(lǐng)先的DPU技術(shù)體系。今天,我們對DPU在云和智算場景的系統(tǒng)級解決方案展開探討,相信DPU會在未來的算力網(wǎng)絡(luò)中發(fā)揮越來越大的作用!
中國聯(lián)通網(wǎng)絡(luò)通信首席專家曹暢在《DPU賦能算網(wǎng)融合》演講中闡述,算、存、運(yùn)一體協(xié)同的算力基礎(chǔ)設(shè)施才能發(fā)揮算力最大價(jià)值,更好應(yīng)對AI發(fā)展需求。從NIC發(fā)展而來的DPU,作為新型主力芯片,正在以“專有芯片做專有任務(wù)”的加速,從更加底層的數(shù)據(jù)處理及應(yīng)用部署方式滿足智算等互聯(lián)業(yè)務(wù)對“算存網(wǎng)管效安”的需求,提升數(shù)據(jù)流轉(zhuǎn)的性能和安全,賦能算網(wǎng)融合的千場萬景。
比如在通信云場景中,DPU作為一種新型計(jì)算技術(shù),可支持網(wǎng)絡(luò)、存儲、安全、管理等基礎(chǔ)設(shè)施層功能卸載,提升通信云的資源利用率和安全性等。在算力服務(wù)場景中,算力服務(wù)網(wǎng)關(guān)調(diào)用DPU資源實(shí)現(xiàn)算力能力卸載與數(shù)據(jù)高效轉(zhuǎn)發(fā),提高算力服務(wù)的效率、使用體驗(yàn)與安全性。而針對智算網(wǎng)絡(luò)中的RDMA RoCE問題,DPU也能提供優(yōu)化解決方案,克服TCP/IP協(xié)議限制,促進(jìn)數(shù)據(jù)高效傳輸。
最后,曹老師也提到,DPU的關(guān)鍵創(chuàng)新在于其以數(shù)據(jù)為中心的新型計(jì)算理念,并可以此為契機(jī)拉動(dòng)產(chǎn)業(yè)鏈上下游形成對算網(wǎng)架構(gòu)、標(biāo)準(zhǔn)等技術(shù)體系的共識。
中科馭數(shù)應(yīng)用研發(fā)部總經(jīng)理陳巖在《高性能網(wǎng)絡(luò)技術(shù)創(chuàng)新的基座——數(shù)據(jù)網(wǎng)絡(luò)應(yīng)用開發(fā)平臺 DNDP》分享中表示,“算中有網(wǎng), 網(wǎng)中有算”的算網(wǎng)融合是算力架構(gòu)的演進(jìn)趨勢。中科馭數(shù)針對當(dāng)前數(shù)據(jù)網(wǎng)絡(luò)開發(fā)的痛點(diǎn),如平臺封閉性、基礎(chǔ)組件缺乏及復(fù)雜場景驗(yàn)證難題,創(chuàng)新研發(fā)了“開物”數(shù)據(jù)網(wǎng)絡(luò)應(yīng)用開發(fā)平臺。
該平臺集可編程性與豐富組件于一體,支持軟硬件二次開發(fā),配備充足硬件資源與調(diào)試工具鏈,實(shí)現(xiàn)即插即用,簡化復(fù)雜場景搭建。開物平臺的軟硬結(jié)合架構(gòu),包含可定制的DPU核心組件與HADOS軟件平臺,大幅縮短算法至系統(tǒng)部署周期,賦能存儲網(wǎng)絡(luò)、網(wǎng)絡(luò)安全、在網(wǎng)計(jì)算、基礎(chǔ)網(wǎng)絡(luò)、云原生網(wǎng)絡(luò)、智算網(wǎng)絡(luò)等多領(lǐng)域創(chuàng)新,共同推進(jìn)網(wǎng)絡(luò)技術(shù)與算法研究的前沿發(fā)展。
中國移動(dòng)研究院基礎(chǔ)網(wǎng)絡(luò)所數(shù)據(jù)中心網(wǎng)絡(luò)研究室主任王瑞雪在《基于DPU的全調(diào)度以太網(wǎng)技術(shù)思考與實(shí)踐》演講中指出,AI大模型以GPU集群分布式訓(xùn)練為基礎(chǔ),帶來大量節(jié)點(diǎn)間通信消耗,網(wǎng)絡(luò)成為AI算力“瓶頸”,以網(wǎng)強(qiáng)算對我國更加重要。網(wǎng)絡(luò)設(shè)備能力決定GPU集群組網(wǎng)規(guī)模、網(wǎng)絡(luò)性能決定GPU集群算力加速比、網(wǎng)絡(luò)可用性決定GPU集群穩(wěn)定性。因此,智算中心以太網(wǎng)技術(shù)路線基本形成產(chǎn)業(yè)共識,技術(shù)生態(tài)和產(chǎn)業(yè)規(guī)模是核心競爭力。
中國移動(dòng)原創(chuàng)性提出全調(diào)度以太網(wǎng)(GSE)技術(shù)體系,革新以太網(wǎng)轉(zhuǎn)發(fā)機(jī)制,基于三大核心機(jī)制轉(zhuǎn)變,實(shí)現(xiàn)高精度負(fù)載均衡、網(wǎng)絡(luò)層原生無損及低延遲。GSE為適應(yīng)不同場景的需求,分為純網(wǎng)絡(luò)方案和端網(wǎng)協(xié)同兩條技術(shù)路線。端網(wǎng)協(xié)同方案是高性能智算中心網(wǎng)絡(luò)技術(shù)趨勢。在這個(gè)場景中,DPU作為網(wǎng)絡(luò)中GSP節(jié)點(diǎn),需具備高效亂序報(bào)文處理與主動(dòng)擁塞控制能力,進(jìn)一步優(yōu)化網(wǎng)絡(luò)規(guī)模與性能表現(xiàn)。
天翼云資深研發(fā)專家鄒明在《創(chuàng)新算力架構(gòu)——天翼云紫金DPU推動(dòng)算力普惠》演講中指出,隨著互聯(lián)網(wǎng)和AI業(yè)務(wù)的發(fā)展,傳統(tǒng)以CPU為核心的算力架構(gòu),面臨著虛擬化組件消耗服務(wù)器資源多,虛擬化業(yè)務(wù)性能差,新的算力平臺適配推廣困難的諸多挑戰(zhàn)。為了應(yīng)對這些挑戰(zhàn),天翼云作為云服務(wù)國家隊(duì),積極應(yīng)對算力挑戰(zhàn),自研紫金DPU,通過虛擬化組件卸載、多種業(yè)務(wù)硬件加速以及自研三棧合一高性能網(wǎng)絡(luò)協(xié)議,使得天翼云紫金DPU具備高性能、高可靠性、低成本、簡單易用的特點(diǎn),在天翼云公有云、混合云和集團(tuán)各項(xiàng)業(yè)務(wù)上云環(huán)境中大規(guī)模部署,業(yè)務(wù)場景涵蓋通算、超算、智算等各項(xiàng)場景。
特別是在智能計(jì)算場景中,引入紫金DPU后,不僅簡化了VPC(虛擬私有云)和對象存儲的VxLAN接入過程,還提供了RoCE并行文件存儲的直接接入能力,極大減少了網(wǎng)絡(luò)層面的冗余,降低了整體網(wǎng)絡(luò)架構(gòu)的復(fù)雜性,進(jìn)而提高了數(shù)據(jù)中心的效率和響應(yīng)速度。在傳統(tǒng)通算場景中,通過紫金DPU的卸載以及軟硬融合的硬件加速技術(shù),實(shí)實(shí)現(xiàn)虛擬化“零”損耗,業(yè)務(wù)性能大幅提升,并且支持一云多芯,加速了國產(chǎn)化算力的推廣。
北京郵電大學(xué)汪碩在《可編程網(wǎng)絡(luò)探索與實(shí)踐》演講中表示,為應(yīng)對人工智能和高性能計(jì)算給網(wǎng)絡(luò)來的挑戰(zhàn),構(gòu)建新質(zhì)生產(chǎn)力所需的大帶寬、低延遲、高可靠網(wǎng)絡(luò),定制化協(xié)議與可編程設(shè)備已成為未來網(wǎng)絡(luò)重要的演進(jìn)趨勢,并初步形成覆蓋芯片、硬件、軟件的完整生態(tài)。網(wǎng)絡(luò)通信與安全紫金山實(shí)驗(yàn)室聯(lián)合北京郵電大學(xué)通過發(fā)布全球首個(gè)骨干網(wǎng)可編程操作系統(tǒng)UniNOS,支持運(yùn)營商級骨干網(wǎng)絡(luò)功能,成功適配主流異構(gòu)交換芯片,已在長三角區(qū)域骨干網(wǎng)白盒平面與紫金山無損數(shù)據(jù)中心應(yīng)用,支撐PB級算力數(shù)據(jù)中心的大規(guī)模落地驗(yàn)證。新型可編程的確定性網(wǎng)絡(luò)可解決網(wǎng)絡(luò)利用效率、丟包等問題,推動(dòng)互聯(lián)網(wǎng)從“盡力而為”到“確保所需”技術(shù)體系變革,能夠滿足數(shù)據(jù)傳輸、算力互聯(lián)等典型場景的網(wǎng)絡(luò)需求。
中科馭數(shù)產(chǎn)品運(yùn)營部副總經(jīng)理李冬在《基于DPU的高性能云底座探索與實(shí)踐》演講中表示,云計(jì)算技術(shù)體系中,DPU是串聯(lián)網(wǎng)絡(luò)、存儲、安全、虛擬化、裸金屬、容器等各個(gè)業(yè)務(wù)系統(tǒng)的核心要素。也是基于這一理解,IaaS on DPU(IoD)技術(shù)的核心思想,即將云計(jì)算基礎(chǔ)設(shè)施組件下沉至DPU。
中科馭數(shù)基于IoD技術(shù)打造的解決方案統(tǒng)一管理計(jì)算和裸金屬節(jié)點(diǎn),確保99%的服務(wù)器資源直接服務(wù)于客戶業(yè)務(wù),大幅提升基礎(chǔ)設(shè)施的業(yè)務(wù)處理能力,單機(jī)吞吐量提升4倍,存儲IOPS性能提升1.5倍。針對券商低時(shí)延服務(wù),中科馭數(shù)通過DPU卸載代理流量,采用用戶態(tài)協(xié)議棧繞過內(nèi)核,自主研發(fā)服務(wù)網(wǎng)格快路徑,將業(yè)務(wù)訪問時(shí)延降至130微秒,降低70%,并減少服務(wù)器CPU消耗達(dá)20%。在公有云裸金屬服務(wù)中,中科馭數(shù)的解決方案實(shí)現(xiàn)了分鐘級交付,無需PXE或操作系統(tǒng)安裝,通過集中式代理模式替代邊車模式,減少了資源消耗,提升了配置的簡易性和靈活性。
展望未來,IoD技術(shù)將持續(xù)演進(jìn),涵蓋可觀測性、輕量級虛擬化、軟硬協(xié)同擁塞控制等多個(gè)領(lǐng)域,引領(lǐng)DPU技術(shù)在云計(jì)算領(lǐng)域的廣泛應(yīng)用。
在圓桌論壇環(huán)節(jié),主持人盧文巖、天翼云鄒明、北京郵電大學(xué)汪碩、中科馭數(shù)陳巖、李冬五位嘉賓深入探討了DPU技術(shù)在云和智算領(lǐng)域的革新與挑戰(zhàn)。專家們也一致認(rèn)為,DPU的本質(zhì)在于性能加速,通過算力卸載提升效率,從產(chǎn)業(yè)來看,當(dāng)前DPU技術(shù)路線和產(chǎn)業(yè)應(yīng)用趨勢也正逐漸清晰,在智算場景和云原生場景中將大有可為。
專家們也提到,標(biāo)準(zhǔn)化、生態(tài)建設(shè)與人才培養(yǎng),仍是DPU技術(shù)廣泛應(yīng)用前必須跨越的障礙。DPU的標(biāo)準(zhǔn)化有助于降低使用門檻,促進(jìn)技術(shù)的廣泛接受;生態(tài)系統(tǒng)的健全則能吸引更多的開發(fā)者與合作伙伴,加速技術(shù)迭代與創(chuàng)新;而高校與產(chǎn)業(yè)界的深度融合,則能培養(yǎng)出更多具備實(shí)戰(zhàn)經(jīng)驗(yàn)的人才,為DPU技術(shù)的長遠(yuǎn)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。開物K-Machine的發(fā)布,正是中科馭數(shù)邁向教育領(lǐng)域的第一步,旨在培養(yǎng)DPU專業(yè)人才,讓開發(fā)者能夠以低的成本、更短的開發(fā)周期進(jìn)行網(wǎng)絡(luò)研究與算法開發(fā)。
DPU技術(shù)已逐步走向成熟、邁向應(yīng)用大規(guī)模推廣的階段,行業(yè)同仁們更多地開始討論DPU在數(shù)據(jù)中心和云計(jì)算環(huán)境中解決系統(tǒng)層面的“大問題”。中科馭數(shù)非常榮幸成為這一進(jìn)程的參與者和推動(dòng)者,我們將繼續(xù)致力于底層技術(shù)的創(chuàng)新與生態(tài)建設(shè),推動(dòng)DPU技術(shù)在算力基礎(chǔ)設(shè)施中的普及和深化應(yīng)用。邀您共同見證DPU在云計(jì)算和智算領(lǐng)域的深遠(yuǎn)影響。
-
DPU
+關(guān)注
關(guān)注
0文章
406瀏覽量
26139 -
云原生
+關(guān)注
關(guān)注
0文章
265瀏覽量
8493 -
中科馭數(shù)
+關(guān)注
關(guān)注
0文章
141瀏覽量
4529
原文標(biāo)題:DPU技術(shù)趨勢和應(yīng)用——DPU在云原生與智算網(wǎng)絡(luò)中的探索與實(shí)踐 | CCF Chip 2024
文章出處:【微信號:yusurtech,微信公眾號:馭數(shù)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
中科馭數(shù)亮相2025 CCF全國高性能計(jì)算學(xué)術(shù)大會
云原生環(huán)境里Nginx的故障排查思路
中科馭數(shù)攜DPU全棧產(chǎn)品亮相福州數(shù)博會,賦能智算時(shí)代算力基建
中科馭數(shù)受邀出席2025中關(guān)村論壇
中科馭數(shù)受邀參與華泰證券春季投資峰會 分享DPU在AI領(lǐng)域的應(yīng)用
中科馭數(shù)攜手合作伙伴共同舉辦先進(jìn)計(jì)算沙龍
鄭州市領(lǐng)導(dǎo)蒞臨中科馭數(shù)調(diào)研
中科馭數(shù)K2-Pro芯片助力智算中心創(chuàng)新
云原生AI服務(wù)怎么樣
云原生LLMOps平臺作用
中科馭數(shù)獲批設(shè)立博士后科研工作站 加強(qiáng)DPU產(chǎn)學(xué)研合作
中科馭數(shù)憑借在DPU芯片領(lǐng)域的積累被認(rèn)定為北京市知識產(chǎn)權(quán)優(yōu)勢單位

中科馭數(shù)分析DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實(shí)際應(yīng)用
評論