在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡(luò)、存儲和安全等領(lǐng)域的創(chuàng)新突破。
由劉松,雷瑋琛,張琳,高鎧煒,苑新婧組成的 FireMoth42 團(tuán)隊?wèi){借其項目“基于 NVIDIA BlueField DPU 的 5G UPF 數(shù)據(jù)面加速方案”,成功將 5G 用戶面功能(UPF)卸載到 DPU,實(shí)現(xiàn)了數(shù)據(jù)面的加速和低時延處理,為邊緣網(wǎng)絡(luò)架構(gòu)帶來新的可能。
聚焦可編程網(wǎng)絡(luò) 從實(shí)驗(yàn)到項目落地
FireMoth42 團(tuán)隊的研究方向長期聚焦于可編程網(wǎng)絡(luò)、5G 與邊緣計算的發(fā)展。在實(shí)際研究與行業(yè)調(diào)研中,他們注意到:隨著網(wǎng)絡(luò)流量和用戶數(shù)量急劇增長,UPF 已成為電信網(wǎng)絡(luò)核心網(wǎng)的性能瓶頸之一。而 NVIDIA BlueField DPU 的推出,為他們提供了將數(shù)據(jù)面(UPF)處理任務(wù)從通用服務(wù)器卸載到 DPU 專用加速硬件的絕佳契機(jī)。
“基于 DOCA Flow 庫,我們在 NVIDIA BlueField DPU 上實(shí)現(xiàn)了 UPF 的數(shù)據(jù)面處理,并設(shè)計了一套針對大流與小流的差異化轉(zhuǎn)發(fā)策略,”團(tuán)隊介紹道,“大流通過 eSwitch 直接轉(zhuǎn)發(fā),小流則由 CPU 處理,從而在性能與資源之間取得最優(yōu)平衡?!?/p>
深挖 DOCA 官方文檔 破局開發(fā)瓶頸
由于 DOCA Flow 庫是一個高度抽象的庫,團(tuán)隊在開發(fā)初期并未能查看到流處理的匹配路徑和狀態(tài)變化,這導(dǎo)致了一些未知錯誤,比如數(shù)據(jù)包并未按照設(shè)計的匹配條件進(jìn)行正確轉(zhuǎn)發(fā),并在 pipe 串聯(lián)處理數(shù)量超過 15 個時還出現(xiàn)了數(shù)據(jù)流處理性能下降的問題。團(tuán)隊想要定位這些錯誤和問題出現(xiàn)了較大困難,故在程序調(diào)試上耗費(fèi)了較多的時間,當(dāng)然這也極大的考驗(yàn)了團(tuán)隊的耐心與協(xié)作能力。
面對這些挑戰(zhàn),團(tuán)隊采取了多管齊下的策略。首先,他們深入查閱了 DOCA 官方文檔和 SDK 示例,積極向 NVIDIA 導(dǎo)師團(tuán)隊請教,在導(dǎo)師的幫助下逐步厘清了開發(fā)框架中的多個關(guān)鍵概念,加速了團(tuán)隊對 DOCA Flow 架構(gòu)的理解。
其次,團(tuán)隊還采取“反復(fù)嘗試+精細(xì)驗(yàn)證”的策略。在調(diào)試過程中,重復(fù)執(zhí)行“注釋和添加代碼——編譯——運(yùn)行——測試”的閉環(huán)流程。通過對代碼邏輯進(jìn)行精細(xì)拆分與變動,逐步縮小問題范圍,嘗試各種可能的配置組合,從而找出導(dǎo)致行為異常的根本原因。
此外,為了解決性能瓶頸定位難的問題,團(tuán)隊還編寫了一系列 DOCA Flow 測試程序,通過簡化邏輯、控制變量,逐步推導(dǎo)出 pipe 串聯(lián)與表項下發(fā)的最佳實(shí)踐,為后續(xù)優(yōu)化提供了堅實(shí)依據(jù)。
流量分發(fā)邏輯的全面創(chuàng)新
本項目的核心創(chuàng)新在于實(shí)現(xiàn)了 5G UPF 從通用 CPU 到BlueField DPU的卸載與加速。團(tuán)隊不僅將數(shù)據(jù)面轉(zhuǎn)發(fā)邏輯遷移至 BlueField DPU,還結(jié)合了實(shí)際網(wǎng)絡(luò)流量在大、小流上的差異特征,設(shè)計了一套基于流量分類的轉(zhuǎn)發(fā)策略:將大流直接通過 eSwitch 轉(zhuǎn)發(fā),以降低 CPU 干預(yù)和轉(zhuǎn)發(fā)延遲;而將小流保留在 CPU 側(cè)處理,實(shí)現(xiàn)資源分配的最優(yōu)化。
在應(yīng)用落地方面,該方案特別適用于未來的邊緣電信場景,尤其是 MEC(邊緣計算)架構(gòu)下的小型數(shù)據(jù)中心或邊緣匯聚點(diǎn)。相比傳統(tǒng)方案,基于 DPU 的 UPF 加速模型不僅具備更低的時延、更優(yōu)的能耗效率,還能有效釋放邊緣機(jī)房中寶貴的 CPU 資源,將其用于更多控制面、業(yè)務(wù)邏輯和 AI 推理等其他處理任務(wù)。
DOCA 開發(fā)者快問快答
Q
您是從哪里了解到 NVIDIA DPU 黑客松競賽的?參賽的目標(biāo)是什么?
A
我們在搜索 BlueField DPU 資料時通過知乎和搜索引擎了解到此次競賽。參賽是為了系統(tǒng)的學(xué)習(xí)和使用 DOCA SDK,并與業(yè)界同行交流。
Q
賽前舉辦的 DPU 線上技術(shù)訓(xùn)練營對您的備賽起到哪些幫助?
A
在訓(xùn)練營中,NVIDIA 導(dǎo)師系統(tǒng)講解了 DPU 架構(gòu)、DOCA 軟件棧以及典型開發(fā)案例。這幫我們快速建立了對 DOCA 開發(fā)框架和 BlueField 應(yīng)用場景的整體認(rèn)知,尤其是 DOCA Flow 的處理機(jī)制和代碼實(shí)例,為我們節(jié)省了大量入門時間。
Q
參與 NVIDIA DPU 黑客松競賽有哪些收獲?
A
此次競賽對我們來說是一次完整的系統(tǒng)級工程開發(fā)體驗(yàn)。從搭建環(huán)境、明確需求、模塊劃分到調(diào)試聯(lián)通,每一步都考驗(yàn)團(tuán)隊協(xié)作與問題解決能力。我們不僅掌握了 DOCA 開發(fā)的核心流程,也深刻體會到 DPU 技術(shù)在現(xiàn)代網(wǎng)絡(luò)基礎(chǔ)設(shè)施中的應(yīng)用潛力。
Q
本次競賽有沒有難忘或有趣的經(jīng)歷?
A
太多了,有一次因?yàn)樯賹懸粋€下發(fā)語句,導(dǎo)致表項遲遲不生效,排查了 40 多分鐘才找到問題。還有一次因字節(jié)序問題導(dǎo)致 ARM 側(cè)計算結(jié)果完全顛倒。解決這些問題的過程既痛苦又充滿成就感。
Q
團(tuán)隊里是否有女性開發(fā)者?她們發(fā)揮了怎樣的作用?
A
我們團(tuán)隊共有兩位女性成員,她們不僅參與核心架構(gòu)設(shè)計,還在代碼實(shí)現(xiàn)、性能測試、調(diào)試驗(yàn)證中發(fā)揮關(guān)鍵作用。她們思維細(xì)膩、耐心包容,經(jīng)常能在團(tuán)隊陷入困境時提出新思路,也是團(tuán)隊的“粘合劑”,增強(qiáng)了整體凝聚力。
這次競賽也讓我們意識到,技術(shù)從不是某類群體的專屬舞臺,而是每一個熱愛探索、勇于挑戰(zhàn)的開發(fā)者共同創(chuàng)造的空間。
Q
什么契機(jī)讓您成為 DOCA 開發(fā)者?
A
我們實(shí)驗(yàn)室的研究方向本身就聚焦于可編程網(wǎng)絡(luò),而其中最重要的設(shè)備類型就是可編程交換機(jī)與智能網(wǎng)卡。BlueField DPU 正是智能網(wǎng)卡領(lǐng)域中的代表性硬件,它不僅在工業(yè)界的實(shí)際部署中表現(xiàn)優(yōu)異,在學(xué)術(shù)研究中也逐漸成為熱點(diǎn)。因此,作為研究生,我們也想探索 BlueFiled 的強(qiáng)大功能,故而逐步走上了 DOCA 開發(fā)者的道路。
Q
您對 DOCA 和DOCA 中國開發(fā)者社區(qū)有何評價?
A
DOCA 是我們用過文檔最完整、功能也最豐富的網(wǎng)絡(luò)加速開發(fā)工具之一。無論是開發(fā)框架、API 文檔,還是代碼示例,整體結(jié)構(gòu)都非常清晰,對新手來說也非常友好。
DOCA 中國開發(fā)者社區(qū)也給了我們很多幫助。無論是查資料、問問題,還是參與線上活動、獲取導(dǎo)師建議,都非常高效。社區(qū)里的技術(shù)氛圍也很好,很適合成長、交流和結(jié)識志同道合的伙伴。
開發(fā)者寄語
“技術(shù)的賽場不分性別,而是每一個熱愛探索的人的共同舞臺。歡迎更多同學(xué)加入 DPU 與 DOCA 的開發(fā)行列,在邊緣智能與網(wǎng)絡(luò)創(chuàng)新的浪潮中,寫下屬于你們的代碼故事!”
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5430瀏覽量
108196 -
服務(wù)器
+關(guān)注
關(guān)注
13文章
9994瀏覽量
90059 -
DPU
+關(guān)注
關(guān)注
0文章
403瀏覽量
25746
原文標(biāo)題:開發(fā)者故事 | 將 5G UPF 卸載至 DPU,實(shí)現(xiàn)邊緣網(wǎng)絡(luò)數(shù)據(jù)面加速
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
5G與6G:從“萬物互聯(lián)“到“智能無界“的跨越
NVIDIA助力Axio團(tuán)隊打造全新DPU數(shù)據(jù)面開發(fā)框架
科普 | 5G支持的WWC架構(gòu)是個啥(2)?

利用NVIDIA DPU重塑網(wǎng)絡(luò)安全格局
NVIDIA DOCA 3.0版本的亮點(diǎn)解析

5G RedCap網(wǎng)關(guān)是什么
熱門5G路由器參數(shù)對比,華為智選Brovi 5G CPE 5 VS SUNCOMM SDX75
第三屆NVIDIA DPU黑客松開啟報名
廣和通發(fā)布5G AI MiFi解決方案
5G網(wǎng)絡(luò)優(yōu)化中,信令測試儀如何幫助故障排查?
基于千兆5G網(wǎng)關(guān)的5G急救車方案

利用NVIDIA DPF引領(lǐng)DPU加速云計算的未來

在NVIDIA BlueField-3 DPU上運(yùn)行WEKA客戶端的實(shí)際優(yōu)勢

評論