chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力Axio團(tuán)隊(duì)打造全新DPU數(shù)據(jù)面開(kāi)發(fā)框架

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-08-30 15:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在第三屆 NVIDIA DPU 黑客松競(jìng)賽中,我們見(jiàn)證了開(kāi)發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。在 23 支參賽隊(duì)伍中,有 5 支隊(duì)伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡(luò)、存儲(chǔ)和安全等領(lǐng)域的創(chuàng)新突破。

黃昕陽(yáng)、劉博文、任正行、張?jiān)栖帯⑾柚藿M成的 Axio 團(tuán)隊(duì)在本屆黑客松中展現(xiàn)出卓越的技術(shù)實(shí)力,其創(chuàng)新項(xiàng)目“面向DPU 加速的業(yè)務(wù)的高性能數(shù)據(jù)面開(kāi)發(fā)框架”,榮獲第三名。該項(xiàng)目通過(guò)系統(tǒng)化的設(shè)計(jì)原則和編程接口,有效突破了傳統(tǒng)數(shù)據(jù)面開(kāi)發(fā)方法的性能瓶頸,顯著提升了 DPU 程序的開(kāi)發(fā)效率。

DPU 數(shù)據(jù)面開(kāi)發(fā)框架的創(chuàng)新設(shè)計(jì)與實(shí)現(xiàn)

在現(xiàn)代數(shù)據(jù)中心網(wǎng)絡(luò)中,DPU 的硬件架構(gòu)為高性能數(shù)據(jù)處理提供了新的可能性,然而傳統(tǒng)的開(kāi)發(fā)方法難以充分發(fā)揮其潛力。基于以往 DPU 的開(kāi)發(fā)經(jīng)驗(yàn),Axio 團(tuán)隊(duì)發(fā)現(xiàn) DPU 數(shù)據(jù)面和 CPUGPU 數(shù)據(jù)面的設(shè)計(jì)原則存在顯著差異,采用傳統(tǒng)的數(shù)據(jù)面設(shè)計(jì)方法開(kāi)發(fā) DPU 加速的應(yīng)用程序會(huì)導(dǎo)致性能下降。基于這一問(wèn)題,Axio 團(tuán)隊(duì)提出了一套全新的 DPU 數(shù)據(jù)面開(kāi)發(fā)框架。該框架系統(tǒng)化了 DPU 硬件架構(gòu)的設(shè)計(jì)原則,開(kāi)發(fā)出相應(yīng)的編程接口和運(yùn)行時(shí)框架,從而顯著提升了 DPU 加速的應(yīng)用程序的性能。

從需求分析到技術(shù)實(shí)現(xiàn)的全過(guò)程中,Axio 團(tuán)隊(duì)展現(xiàn)了扎實(shí)的專業(yè)知識(shí)和高效的協(xié)作能力。

攻克底層難題,實(shí)現(xiàn)性能提升

在開(kāi)發(fā)過(guò)程中,團(tuán)隊(duì)面臨的核心挑戰(zhàn)來(lái)自于底層編程庫(kù)的“無(wú)人區(qū)”。由于框架開(kāi)發(fā)涉及最底層的編程庫(kù)(如 librdma 和 flexio),網(wǎng)絡(luò)上幾乎找不到可參考的案例,團(tuán)隊(duì)遇到的每一個(gè) bug 都像一道需要原創(chuàng)解法的高數(shù)題。

“每次遇到問(wèn)題,我們都需要花費(fèi)大量時(shí)間排查。”黃昕陽(yáng)解釋道。依托 DOCA 社區(qū)的幫助,團(tuán)隊(duì)仔細(xì)閱讀底層代碼庫(kù)的文檔,逐步驗(yàn)證每一個(gè) API 調(diào)用的正確性。此外,團(tuán)隊(duì)還編寫了一些示例來(lái)驗(yàn)證 DPU 的配置的合理性。最終,成功解決了這些問(wèn)題,構(gòu)建出高性能的數(shù)據(jù)面框架,為后續(xù)開(kāi)發(fā)防火墻、虛擬交換機(jī)等功能奠定了基礎(chǔ)。

對(duì)未來(lái)數(shù)據(jù)中心網(wǎng)絡(luò)的展望

本次項(xiàng)目的創(chuàng)新之處在于其系統(tǒng)化的設(shè)計(jì)原則和高性能的編程接口。Axio 團(tuán)隊(duì)的框架不僅解決了 DPU 開(kāi)發(fā)中的性能瓶頸,還為未來(lái)數(shù)據(jù)中心網(wǎng)絡(luò)的高效運(yùn)行提供了新的可能性。展望未來(lái),團(tuán)隊(duì)計(jì)劃結(jié)合 NVIDIA DOCA 軟件框架和 NVIDIA BlueField-3 DPU 強(qiáng)大的硬件特性,繼續(xù)深入探索 DPU 在 AI 和云場(chǎng)景中的更多應(yīng)用,例如加速終端內(nèi)部的數(shù)據(jù)搬運(yùn)和協(xié)議棧處理,實(shí)現(xiàn)終端負(fù)載均衡。

談及未來(lái) DPU 領(lǐng)域的發(fā)展前景,黃昕陽(yáng)指出:“在 AI 時(shí)代,DPU 憑借其獨(dú)特的生態(tài)位展現(xiàn)出巨大潛力——不僅能作為加速器優(yōu)化 GPU 間通信,還可以充當(dāng)控制器實(shí)現(xiàn)以 AI 為中心的智能組網(wǎng),這讓我對(duì) DPU 的未來(lái)充滿信心。”

DOCA 開(kāi)發(fā)者快問(wèn)快答

Q

您是從哪里了解到 NVIDIA DPU 黑客松競(jìng)賽的?參賽的目標(biāo)是什么?

A

我們通過(guò)NVIDIA 官方微信公眾號(hào)了解到本次競(jìng)賽。參賽的核心目標(biāo)是與其他同行交流,聽(tīng)取大家對(duì)我們項(xiàng)目的建議,同時(shí)提升我們?cè)?DPU 開(kāi)發(fā)領(lǐng)域的技術(shù)能力。

Q

賽前舉辦的 DPU 線上技術(shù)訓(xùn)練營(yíng)對(duì)您的備賽起到哪些幫助?

A

訓(xùn)練營(yíng)讓我們對(duì) DPU 開(kāi)發(fā)庫(kù)有了更全面的了解,也提供了與 NVIDIA 專家直接溝通的機(jī)會(huì),幫助我們少走了許多彎路。

Q

參與 NVIDIA DPU 黑客松競(jìng)賽有哪些收獲?

A

最大的收獲是與同行交流,解決了一些項(xiàng)目遺留的問(wèn)題。例如,在實(shí)現(xiàn) DPA 處理 RDMA 流時(shí),我們通過(guò)交流發(fā)現(xiàn)并糾正了 DPU 配置中的錯(cuò)誤,順利完成了后續(xù)開(kāi)發(fā)。

Q

您是從什么渠道了解到 NVIDIA DOCA 的?什么契機(jī)使您成為 DOCA 開(kāi)發(fā)者?

A

作為網(wǎng)絡(luò)研究領(lǐng)域的博士生,我們一直關(guān)注最新的網(wǎng)絡(luò)設(shè)備。DPU 是網(wǎng)絡(luò)研究的重要工具,而 DOCA 簡(jiǎn)化了 DPU 開(kāi)發(fā)流程,因此成為 DOCA 開(kāi)發(fā)者也是一種必然。最早在 2022 年接觸 DOCA 時(shí),我主要研究 BlueField-2 DPU 的 RDMA 可編程化應(yīng)用。隨著 BlueField-3 DPU 的發(fā)布,我便轉(zhuǎn)向探索 DPU 在數(shù)據(jù)加速和 AI 負(fù)載均衡的應(yīng)用,這促使我們參加黑客松以尋求更多技術(shù)交流。

Q

最初從事 DOCA 開(kāi)發(fā)時(shí),有具體明確的目標(biāo)嗎?

A

最初的目標(biāo)是探索 DPU 在高速網(wǎng)絡(luò)中的生態(tài)位,研究其能否加速 CPU/GPU 網(wǎng)絡(luò) I/O。后來(lái)逐漸轉(zhuǎn)向 DPU OS 的優(yōu)化和特定應(yīng)用的數(shù)據(jù)面框架開(kāi)發(fā)。這些都是服務(wù)于網(wǎng)絡(luò)系統(tǒng)的研究。

Q

過(guò)往有其他成功的 DOCA 開(kāi)發(fā)經(jīng)歷嗎?

A

最近我們用 DPU 和 DOCA 實(shí)現(xiàn)了對(duì) CPU I/O 通信中的 L3 緩存資源的優(yōu)化,也作為成果發(fā)表在 ACM SIGCOMM 中。這個(gè)項(xiàng)目重點(diǎn)使用 DPU 中的 DPA 和 Arm 核心作為網(wǎng)絡(luò) I/O 通信的控制器,在網(wǎng)絡(luò)數(shù)據(jù)流進(jìn)入 L3 緩存前預(yù)先調(diào)速,防止 L3 緩存出現(xiàn)溢出;并且利用 DPU 片上 DRAM 資源去預(yù)防網(wǎng)絡(luò) burst 等場(chǎng)景。

我認(rèn)為 DPU 和 DOCA 是實(shí)現(xiàn)學(xué)術(shù)想法的一個(gè)的理想工具,其一是 DPU 具備強(qiáng)大的性能支撐,可提供高達(dá) 400Gbps 的網(wǎng)絡(luò)帶寬;其二是 DOCA 框架大幅降低了開(kāi)發(fā)門檻,特別是 DPA 核的引入使得功能開(kāi)發(fā)更加完備,相比傳統(tǒng) FPGA 開(kāi)發(fā)方式顯著提升了效率。

Q

成為 DOCA 開(kāi)發(fā)者對(duì)未來(lái)職業(yè)發(fā)展有何幫助?

A

成為 DOCA 開(kāi)發(fā)者也可以參與到現(xiàn)在最熱門的 AI 數(shù)據(jù)中心的網(wǎng)絡(luò)研究中,這大大提升未來(lái)就業(yè)的競(jìng)爭(zhēng)力。

Q

NVIDIA DOCA 中國(guó)開(kāi)發(fā)者社區(qū)對(duì)你們有何幫助?

A

社區(qū)提供了豐富的技術(shù)資源和友好的交流環(huán)境,幫助我們解決了許多開(kāi)發(fā)中的難題,也讓我們能夠與其他開(kāi)發(fā)者分享經(jīng)驗(yàn)。

開(kāi)發(fā)者寄語(yǔ)

“高性能網(wǎng)絡(luò)是現(xiàn)代數(shù)據(jù)中心的基石,也是最具挑戰(zhàn)性的領(lǐng)域之一。我們希望更多志同道合的朋友加入進(jìn)來(lái),成為 DOCA 開(kāi)發(fā)者,共同為下一代 AI 和云數(shù)據(jù)中心的網(wǎng)絡(luò)技術(shù)貢獻(xiàn)力量?!?/p>

——Axio 團(tuán)隊(duì)隊(duì)長(zhǎng) 黃昕陽(yáng)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5683

    瀏覽量

    110111
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8333

    瀏覽量

    95554
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    417

    瀏覽量

    27147

原文標(biāo)題:開(kāi)發(fā)者故事 | 構(gòu)建高性能 DPU 數(shù)據(jù)面開(kāi)發(fā)框架

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA 攜手全球機(jī)器人領(lǐng)導(dǎo)者,將物理 AI 帶入現(xiàn)實(shí)世界

    基于 NVIDIA 技術(shù),大規(guī)模開(kāi)發(fā)并部署物理 AI。 NVIDIA 發(fā)布全新 NVIDIA Cosmos 世界模型、
    的頭像 發(fā)表于 03-17 11:22 ?587次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手全球機(jī)器人領(lǐng)導(dǎo)者,將物理 AI 帶入現(xiàn)實(shí)世界

    NVIDIA全新開(kāi)放物理AI模型和框架加速人形機(jī)器人開(kāi)發(fā)

    本文是洞悉 Omniverse 系列文章?!岸聪?Omniverse”重點(diǎn)介紹開(kāi)發(fā)者、3D 從業(yè)者與企業(yè)如何使用 OpenUSD 和 NVIDIA Omniverse 的最新進(jìn)展從根本上變革他們的工作流程。
    的頭像 發(fā)表于 02-06 15:36 ?762次閱讀

    NVIDIA Jetson系列開(kāi)發(fā)者套件助力打造面向未來(lái)的智能機(jī)器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開(kāi)發(fā)者套件,助力打造面向未來(lái)的智能機(jī)器人。
    的頭像 發(fā)表于 12-13 10:20 ?3301次閱讀

    NVIDIA助力新一代機(jī)器人開(kāi)發(fā)開(kāi)源框架

    今年的 ROSCon 在新加坡舉辦,并于 10 月 29 日順利閉幕。大會(huì)吸引了全球機(jī)器人操作系統(tǒng)(ROS)領(lǐng)域開(kāi)發(fā)者的關(guān)注。ROS 是目前全球應(yīng)用最廣泛的機(jī)器人開(kāi)發(fā)開(kāi)源框架
    的頭像 發(fā)表于 11-06 11:55 ?1179次閱讀

    NVIDIA推出面向語(yǔ)言、機(jī)器人和生物學(xué)的全新開(kāi)源AI技術(shù)

    NVIDIA 秉持對(duì)開(kāi)源的長(zhǎng)期承諾,推出了面向語(yǔ)言、機(jī)器人和生物學(xué)的全新開(kāi)源 AI 技術(shù),為構(gòu)建開(kāi)源生態(tài)系統(tǒng)做出貢獻(xiàn),擴(kuò)展 AI 的普及并推動(dòng)創(chuàng)新。NVIDIA 正將這些模型、數(shù)據(jù)和訓(xùn)
    的頭像 發(fā)表于 11-06 11:49 ?1266次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和
    的頭像 發(fā)表于 11-03 14:48 ?1205次閱讀

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標(biāo)是突破 NVIDIA 平臺(tái)上的推理性能瓶頸。為實(shí)現(xiàn)這一目標(biāo),其構(gòu)建了多維度的核心實(shí)現(xiàn)路徑:一
    的頭像 發(fā)表于 10-21 11:04 ?1397次閱讀

    NVIDIA 利用全新開(kāi)源模型與仿真庫(kù)加速機(jī)器人研發(fā)進(jìn)程

    科研人員及開(kāi)發(fā)打造功能更強(qiáng)大、適應(yīng)性更強(qiáng)的機(jī)器人。 ? 全新NVIDIA Isaac GR00T 開(kāi)源基礎(chǔ)模型將為機(jī)器人賦予接近人類的推理能力,使其能夠拆解復(fù)雜指令,并借助已有知
    的頭像 發(fā)表于 09-30 09:52 ?3203次閱讀
    <b class='flag-5'>NVIDIA</b> 利用<b class='flag-5'>全新</b>開(kāi)源模型與仿真庫(kù)加速機(jī)器人研發(fā)進(jìn)程

    基于NVIDIA BlueField DPU的5G UPF數(shù)據(jù)加速方案

    在第三屆 NVIDIA DPU 黑客松競(jìng)賽中,我們見(jiàn)證了開(kāi)發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。在 23 支參賽隊(duì)伍中,有 5 支隊(duì)伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡(luò)、存儲(chǔ)和安全等領(lǐng)
    的頭像 發(fā)表于 09-04 11:26 ?1377次閱讀

    NVIDIA Omniverse Extension開(kāi)發(fā)秘籍

    NVIDIA Omniverse 是一個(gè)模塊化平臺(tái),使用高級(jí) API 和微服務(wù)來(lái)構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的 3D 框架
    的頭像 發(fā)表于 08-22 15:52 ?3843次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension<b class='flag-5'>開(kāi)發(fā)</b>秘籍

    利用NVIDIA DPU重塑網(wǎng)絡(luò)安全格局

    在第三屆 NVIDIA DPU 黑客松競(jìng)賽中,我們見(jiàn)證了開(kāi)發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。在 23 支參賽隊(duì)伍中,有 5 支隊(duì)伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡(luò)、存儲(chǔ)和安全等領(lǐng)
    的頭像 發(fā)表于 08-20 14:31 ?1561次閱讀

    NVIDIA DOCA 3.0版本的亮點(diǎn)解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個(gè)版本都擴(kuò)展了 NVIDIA BlueFie
    的頭像 發(fā)表于 07-04 14:27 ?1377次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮點(diǎn)解析

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機(jī)器人仿真參考應(yīng)用 NVIDIA Isaac Sim 和機(jī)器人學(xué)習(xí)框架 NVIDIA Isaac Lab 的更新,以加速各種形態(tài)
    的頭像 發(fā)表于 05-28 10:06 ?2375次閱讀

    第三屆NVIDIA DPU黑客松開(kāi)啟報(bào)名

    第三屆 NVIDIA DPU 中國(guó)虛擬黑客松(Hackathon)將于 6 月 28 日 - 6 月 30 日正式開(kāi)啟!作為備受廣大開(kāi)發(fā)者期待的年度賽事,它將提供與 NVIDIA 加速
    的頭像 發(fā)表于 05-27 10:16 ?1007次閱讀

    NVIDIA推出NVLink Fusion技術(shù)

    NVIDIA 發(fā)布 NVIDIA NVLink Fusion,這款全新芯片將助力行業(yè)用戶通過(guò)全球領(lǐng)先且廣泛采用的計(jì)算互連架構(gòu) —— NVIDIA
    的頭像 發(fā)表于 05-22 09:59 ?1011次閱讀