chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力Axio團(tuán)隊(duì)打造全新DPU數(shù)據(jù)面開發(fā)框架

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-08-30 15:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。在 23 支參賽隊(duì)伍中,有 5 支隊(duì)伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡(luò)、存儲和安全等領(lǐng)域的創(chuàng)新突破。

黃昕陽、劉博文、任正行、張?jiān)栖?、劉翔洲組成的 Axio 團(tuán)隊(duì)在本屆黑客松中展現(xiàn)出卓越的技術(shù)實(shí)力,其創(chuàng)新項(xiàng)目“面向DPU 加速的業(yè)務(wù)的高性能數(shù)據(jù)面開發(fā)框架”,榮獲第三名。該項(xiàng)目通過系統(tǒng)化的設(shè)計(jì)原則和編程接口,有效突破了傳統(tǒng)數(shù)據(jù)面開發(fā)方法的性能瓶頸,顯著提升了 DPU 程序的開發(fā)效率。

DPU 數(shù)據(jù)面開發(fā)框架的創(chuàng)新設(shè)計(jì)與實(shí)現(xiàn)

在現(xiàn)代數(shù)據(jù)中心網(wǎng)絡(luò)中,DPU 的硬件架構(gòu)為高性能數(shù)據(jù)處理提供了新的可能性,然而傳統(tǒng)的開發(fā)方法難以充分發(fā)揮其潛力?;谝酝?DPU 的開發(fā)經(jīng)驗(yàn),Axio 團(tuán)隊(duì)發(fā)現(xiàn) DPU 數(shù)據(jù)面和 CPUGPU 數(shù)據(jù)面的設(shè)計(jì)原則存在顯著差異,采用傳統(tǒng)的數(shù)據(jù)面設(shè)計(jì)方法開發(fā) DPU 加速的應(yīng)用程序會導(dǎo)致性能下降?;谶@一問題,Axio 團(tuán)隊(duì)提出了一套全新的 DPU 數(shù)據(jù)面開發(fā)框架。該框架系統(tǒng)化了 DPU 硬件架構(gòu)的設(shè)計(jì)原則,開發(fā)出相應(yīng)的編程接口和運(yùn)行時(shí)框架,從而顯著提升了 DPU 加速的應(yīng)用程序的性能。

從需求分析到技術(shù)實(shí)現(xiàn)的全過程中,Axio 團(tuán)隊(duì)展現(xiàn)了扎實(shí)的專業(yè)知識和高效的協(xié)作能力。

攻克底層難題,實(shí)現(xiàn)性能提升

在開發(fā)過程中,團(tuán)隊(duì)面臨的核心挑戰(zhàn)來自于底層編程庫的“無人區(qū)”。由于框架開發(fā)涉及最底層的編程庫(如 librdma 和 flexio),網(wǎng)絡(luò)上幾乎找不到可參考的案例,團(tuán)隊(duì)遇到的每一個(gè) bug 都像一道需要原創(chuàng)解法的高數(shù)題。

“每次遇到問題,我們都需要花費(fèi)大量時(shí)間排查?!秉S昕陽解釋道。依托 DOCA 社區(qū)的幫助,團(tuán)隊(duì)仔細(xì)閱讀底層代碼庫的文檔,逐步驗(yàn)證每一個(gè) API 調(diào)用的正確性。此外,團(tuán)隊(duì)還編寫了一些示例來驗(yàn)證 DPU 的配置的合理性。最終,成功解決了這些問題,構(gòu)建出高性能的數(shù)據(jù)面框架,為后續(xù)開發(fā)防火墻、虛擬交換機(jī)等功能奠定了基礎(chǔ)。

對未來數(shù)據(jù)中心網(wǎng)絡(luò)的展望

本次項(xiàng)目的創(chuàng)新之處在于其系統(tǒng)化的設(shè)計(jì)原則和高性能的編程接口。Axio 團(tuán)隊(duì)的框架不僅解決了 DPU 開發(fā)中的性能瓶頸,還為未來數(shù)據(jù)中心網(wǎng)絡(luò)的高效運(yùn)行提供了新的可能性。展望未來,團(tuán)隊(duì)計(jì)劃結(jié)合 NVIDIA DOCA 軟件框架和 NVIDIA BlueField-3 DPU 強(qiáng)大的硬件特性,繼續(xù)深入探索 DPU 在 AI 和云場景中的更多應(yīng)用,例如加速終端內(nèi)部的數(shù)據(jù)搬運(yùn)和協(xié)議棧處理,實(shí)現(xiàn)終端負(fù)載均衡。

談及未來 DPU 領(lǐng)域的發(fā)展前景,黃昕陽指出:“在 AI 時(shí)代,DPU 憑借其獨(dú)特的生態(tài)位展現(xiàn)出巨大潛力——不僅能作為加速器優(yōu)化 GPU 間通信,還可以充當(dāng)控制器實(shí)現(xiàn)以 AI 為中心的智能組網(wǎng),這讓我對 DPU 的未來充滿信心。”

DOCA 開發(fā)者快問快答

Q

您是從哪里了解到 NVIDIA DPU 黑客松競賽的?參賽的目標(biāo)是什么?

A

我們通過NVIDIA 官方微信公眾號了解到本次競賽。參賽的核心目標(biāo)是與其他同行交流,聽取大家對我們項(xiàng)目的建議,同時(shí)提升我們在 DPU 開發(fā)領(lǐng)域的技術(shù)能力。

Q

賽前舉辦的 DPU 線上技術(shù)訓(xùn)練營對您的備賽起到哪些幫助?

A

訓(xùn)練營讓我們對 DPU 開發(fā)庫有了更全面的了解,也提供了與 NVIDIA 專家直接溝通的機(jī)會,幫助我們少走了許多彎路。

Q

參與 NVIDIA DPU 黑客松競賽有哪些收獲?

A

最大的收獲是與同行交流,解決了一些項(xiàng)目遺留的問題。例如,在實(shí)現(xiàn) DPA 處理 RDMA 流時(shí),我們通過交流發(fā)現(xiàn)并糾正了 DPU 配置中的錯(cuò)誤,順利完成了后續(xù)開發(fā)。

Q

您是從什么渠道了解到 NVIDIA DOCA 的?什么契機(jī)使您成為 DOCA 開發(fā)者?

A

作為網(wǎng)絡(luò)研究領(lǐng)域的博士生,我們一直關(guān)注最新的網(wǎng)絡(luò)設(shè)備。DPU 是網(wǎng)絡(luò)研究的重要工具,而 DOCA 簡化了 DPU 開發(fā)流程,因此成為 DOCA 開發(fā)者也是一種必然。最早在 2022 年接觸 DOCA 時(shí),我主要研究 BlueField-2 DPU 的 RDMA 可編程化應(yīng)用。隨著 BlueField-3 DPU 的發(fā)布,我便轉(zhuǎn)向探索 DPU 在數(shù)據(jù)加速和 AI 負(fù)載均衡的應(yīng)用,這促使我們參加黑客松以尋求更多技術(shù)交流。

Q

最初從事 DOCA 開發(fā)時(shí),有具體明確的目標(biāo)嗎?

A

最初的目標(biāo)是探索 DPU 在高速網(wǎng)絡(luò)中的生態(tài)位,研究其能否加速 CPU/GPU 網(wǎng)絡(luò) I/O。后來逐漸轉(zhuǎn)向 DPU OS 的優(yōu)化和特定應(yīng)用的數(shù)據(jù)面框架開發(fā)。這些都是服務(wù)于網(wǎng)絡(luò)系統(tǒng)的研究。

Q

過往有其他成功的 DOCA 開發(fā)經(jīng)歷嗎?

A

最近我們用 DPU 和 DOCA 實(shí)現(xiàn)了對 CPU I/O 通信中的 L3 緩存資源的優(yōu)化,也作為成果發(fā)表在 ACM SIGCOMM 中。這個(gè)項(xiàng)目重點(diǎn)使用 DPU 中的 DPA 和 Arm 核心作為網(wǎng)絡(luò) I/O 通信的控制器,在網(wǎng)絡(luò)數(shù)據(jù)流進(jìn)入 L3 緩存前預(yù)先調(diào)速,防止 L3 緩存出現(xiàn)溢出;并且利用 DPU 片上 DRAM 資源去預(yù)防網(wǎng)絡(luò) burst 等場景。

我認(rèn)為 DPU 和 DOCA 是實(shí)現(xiàn)學(xué)術(shù)想法的一個(gè)的理想工具,其一是 DPU 具備強(qiáng)大的性能支撐,可提供高達(dá) 400Gbps 的網(wǎng)絡(luò)帶寬;其二是 DOCA 框架大幅降低了開發(fā)門檻,特別是 DPA 核的引入使得功能開發(fā)更加完備,相比傳統(tǒng) FPGA 開發(fā)方式顯著提升了效率。

Q

成為 DOCA 開發(fā)者對未來職業(yè)發(fā)展有何幫助?

A

成為 DOCA 開發(fā)者也可以參與到現(xiàn)在最熱門的 AI 數(shù)據(jù)中心的網(wǎng)絡(luò)研究中,這大大提升未來就業(yè)的競爭力。

Q

NVIDIA DOCA 中國開發(fā)者社區(qū)對你們有何幫助?

A

社區(qū)提供了豐富的技術(shù)資源和友好的交流環(huán)境,幫助我們解決了許多開發(fā)中的難題,也讓我們能夠與其他開發(fā)者分享經(jīng)驗(yàn)。

開發(fā)者寄語

“高性能網(wǎng)絡(luò)是現(xiàn)代數(shù)據(jù)中心的基石,也是最具挑戰(zhàn)性的領(lǐng)域之一。我們希望更多志同道合的朋友加入進(jìn)來,成為 DOCA 開發(fā)者,共同為下一代 AI 和云數(shù)據(jù)中心的網(wǎng)絡(luò)技術(shù)貢獻(xiàn)力量?!?/p>

——Axio 團(tuán)隊(duì)隊(duì)長 黃昕陽

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5489

    瀏覽量

    109016
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8122

    瀏覽量

    93021
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    406

    瀏覽量

    26137

原文標(biāo)題:開發(fā)者故事 | 構(gòu)建高性能 DPU 數(shù)據(jù)面開發(fā)框架

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA推出面向語言、機(jī)器人和生物學(xué)的全新開源AI技術(shù)

    NVIDIA 秉持對開源的長期承諾,推出了面向語言、機(jī)器人和生物學(xué)的全新開源 AI 技術(shù),為構(gòu)建開源生態(tài)系統(tǒng)做出貢獻(xiàn),擴(kuò)展 AI 的普及并推動創(chuàng)新。NVIDIA 正將這些模型、數(shù)據(jù)和訓(xùn)
    的頭像 發(fā)表于 11-06 11:49 ?640次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和
    的頭像 發(fā)表于 11-03 14:48 ?557次閱讀

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標(biāo)是突破 NVIDIA 平臺上的推理性能瓶頸。為實(shí)現(xiàn)這一目標(biāo),其構(gòu)建了多維度的核心實(shí)現(xiàn)路徑:一
    的頭像 發(fā)表于 10-21 11:04 ?710次閱讀

    NVIDIA 利用全新開源模型與仿真庫加速機(jī)器人研發(fā)進(jìn)程

    科研人員及開發(fā)打造功能更強(qiáng)大、適應(yīng)性更強(qiáng)的機(jī)器人。 ? 全新NVIDIA Isaac GR00T 開源基礎(chǔ)模型將為機(jī)器人賦予接近人類的推理能力,使其能夠拆解復(fù)雜指令,并借助已有知
    的頭像 發(fā)表于 09-30 09:52 ?2771次閱讀
    <b class='flag-5'>NVIDIA</b> 利用<b class='flag-5'>全新</b>開源模型與仿真庫加速機(jī)器人研發(fā)進(jìn)程

    基于NVIDIA BlueField DPU的5G UPF數(shù)據(jù)加速方案

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。在 23 支參賽隊(duì)伍中,有 5 支隊(duì)伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡(luò)、存儲和安全等領(lǐng)
    的頭像 發(fā)表于 09-04 11:26 ?835次閱讀

    NVIDIA Omniverse Extension開發(fā)秘籍

    NVIDIA Omniverse 是一個(gè)模塊化平臺,使用高級 API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的 3D 框架
    的頭像 發(fā)表于 08-22 15:52 ?3355次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension<b class='flag-5'>開發(fā)</b>秘籍

    利用NVIDIA DPU重塑網(wǎng)絡(luò)安全格局

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。在 23 支參賽隊(duì)伍中,有 5 支隊(duì)伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡(luò)、存儲和安全等領(lǐng)
    的頭像 發(fā)表于 08-20 14:31 ?994次閱讀

    NVIDIA DOCA 3.0版本的亮點(diǎn)解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個(gè)版本都擴(kuò)展了 NVIDIA BlueFie
    的頭像 發(fā)表于 07-04 14:27 ?879次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮點(diǎn)解析

    第三屆NVIDIA DPU黑客松開啟報(bào)名

    第三屆 NVIDIA DPU 中國虛擬黑客松(Hackathon)將于 6 月 28 日 - 6 月 30 日正式開啟!作為備受廣大開發(fā)者期待的年度賽事,它將提供與 NVIDIA 加速
    的頭像 發(fā)表于 05-27 10:16 ?728次閱讀

    NVIDIA推出NVLink Fusion技術(shù)

    NVIDIA 發(fā)布 NVIDIA NVLink Fusion,這款全新芯片將助力行業(yè)用戶通過全球領(lǐng)先且廣泛采用的計(jì)算互連架構(gòu) —— NVIDIA
    的頭像 發(fā)表于 05-22 09:59 ?693次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨(dú)立工作或以團(tuán)隊(duì)形式完成復(fù)雜
    發(fā)表于 03-19 09:31 ?333次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放推理 AI 模型系列,<b class='flag-5'>助力</b><b class='flag-5'>開發(fā)</b>者和企業(yè)構(gòu)建代理式 AI 平臺

    NVIDIA 發(fā)布全球首個(gè)開源人形機(jī)器人基礎(chǔ)模型 Isaac GR00T N1——并推出加速機(jī)器人開發(fā)的仿真框架

    18 日 ——NVIDIA 今日宣布推出一系列全新技術(shù),助力人形機(jī)器人開發(fā)。其中包括全球首個(gè)開源且完全可定制的基礎(chǔ)模型 NVIDIA Is
    發(fā)表于 03-19 09:30 ?587次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全球首個(gè)開源人形機(jī)器人基礎(chǔ)模型 Isaac GR00T N1——并推出加速機(jī)器人<b class='flag-5'>開發(fā)</b>的仿真<b class='flag-5'>框架</b>

    利用NVIDIA DPF引領(lǐng)DPU加速云計(jì)算的未來

    DPU 的強(qiáng)大功能,并優(yōu)化 GPU 加速計(jì)算平臺。作為一種編排框架和實(shí)施藍(lán)圖,DPF 使開發(fā)者、服務(wù)提供商和企業(yè)能夠無縫構(gòu)建 BlueField 加速的云原生軟件平臺。
    的頭像 發(fā)表于 01-24 09:29 ?1246次閱讀
    利用<b class='flag-5'>NVIDIA</b> DPF引領(lǐng)<b class='flag-5'>DPU</b>加速云計(jì)算的未來

    NVIDIA BlueField-3 DPU上運(yùn)行WEKA客戶端的實(shí)際優(yōu)勢

    WEKA是可擴(kuò)展軟件定義數(shù)據(jù)平臺的先驅(qū),NVIDIA 正在與其合作,將 WEKA 先進(jìn)的數(shù)據(jù)平臺解決方案與功能強(qiáng)大的NVIDIA BlueField
    的頭像 發(fā)表于 01-07 09:43 ?1027次閱讀
    在<b class='flag-5'>NVIDIA</b> BlueField-3 <b class='flag-5'>DPU</b>上運(yùn)行WEKA客戶端的實(shí)際優(yōu)勢

    鴻蒙原生頁面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用

    Nodepool、HMrouter和DataCache 三大解決方案,并上架OpenHarmony開源社區(qū)分,分別針對應(yīng)用頁面滑動、跳轉(zhuǎn)、首頁冷啟動等關(guān)鍵性能場景提供高效易用的工具,助力伙伴和開發(fā)打造
    發(fā)表于 01-02 18:00