chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

爆紅智能AI如何看待DPU

芯啟源 ? 來(lái)源:芯啟源 ? 2023-02-10 14:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上線僅2個(gè)月,OpenAI的最新一代產(chǎn)品-AI聊天機(jī)器人ChatGPT月活用戶接近1億。

作為自然語(yǔ)言處理(NLP)領(lǐng)域的前沿研究成果之一,ChatGPT已成為AIGC里程碑式的產(chǎn)品。

這周我們也與ChatGPT聊了聊他/她對(duì)大規(guī)模預(yù)訓(xùn)練背后所需資源的看法。

讓我們一起來(lái)看看ChatGPT的回答是否能讓你滿意呢?

9f63de06-a8df-11ed-bfe3-dac502259ad0.png

9f8cfb56-a8df-11ed-bfe3-dac502259ad0.png

9fb5eda4-a8df-11ed-bfe3-dac502259ad0.png

強(qiáng)大的語(yǔ)言生成能力現(xiàn)在引起更多討論的是規(guī)模預(yù)訓(xùn)練。在過(guò)去的很長(zhǎng)一段時(shí)間里,許多的AI廠商都是通過(guò)本地設(shè)備來(lái)進(jìn)行訓(xùn)練的。

GPT-3所訓(xùn)練的參數(shù)約為1750億個(gè),這部分需要大量的算力,而目前我們已知ChatGPT導(dǎo)入了至少1萬(wàn)顆英偉達(dá)高端GPU來(lái)訓(xùn)練模型。

a0011ebe-a8df-11ed-bfe3-dac502259ad0.png

a01a0bf4-a8df-11ed-bfe3-dac502259ad0.png

a034200c-a8df-11ed-bfe3-dac502259ad0.png

業(yè)界部分專家認(rèn)為GPT-4訓(xùn)練參數(shù)可能會(huì)達(dá)到100萬(wàn)億個(gè)參數(shù),如此大規(guī)模、長(zhǎng)時(shí)間的GPU集群訓(xùn)練任務(wù),也對(duì)網(wǎng)絡(luò)互聯(lián)底座的性能、可靠性、成本等各方面都提出了極致的要求。

面對(duì)千億、萬(wàn)億參數(shù)規(guī)模的大模型訓(xùn)練,僅僅是單次計(jì)算迭代內(nèi)梯度同步需要的通信量就高達(dá)TB量級(jí)。此外還有各種并行模式、加速框架引入的通信需求,使得傳統(tǒng)低速網(wǎng)絡(luò)的帶寬遠(yuǎn)遠(yuǎn)無(wú)法支撐GPU集群的高效計(jì)算,甚至成為了其中關(guān)鍵的瓶頸。

因此要充分發(fā)揮GPU計(jì)算資源的強(qiáng)大算力,必須構(gòu)建一個(gè)全新的高性能網(wǎng)絡(luò)底座,用高速網(wǎng)絡(luò)的大帶寬來(lái)助推整個(gè)集群計(jì)算的高效率。

a0b178ae-a8df-11ed-bfe3-dac502259ad0.png

a0e8cb24-a8df-11ed-bfe3-dac502259ad0.png

CPU+GPU的異構(gòu)計(jì)算模型已經(jīng)成為高性能計(jì)算領(lǐng)域中的主流計(jì)算架構(gòu)。而高吞吐、低延時(shí)是高性能計(jì)算場(chǎng)景中最為迫切的應(yīng)用需求。

a124efc8-a8df-11ed-bfe3-dac502259ad0.png

a14629cc-a8df-11ed-bfe3-dac502259ad0.png

a1dac668-a8df-11ed-bfe3-dac502259ad0.png

我們可以知道,GPUDirect RDMA是RDMA在異構(gòu)計(jì)算場(chǎng)景中的應(yīng)用延伸,使得GPU之間的通信不在依賴CPU轉(zhuǎn)發(fā),從而進(jìn)一步提升高性能計(jì)算場(chǎng)景中整體算力。

從DPU芯片的實(shí)現(xiàn)角度看,不同DPU廠商的核心競(jìng)爭(zhēng)壁壘在于專用加速引擎的硬件實(shí)現(xiàn)上。由于DPU是數(shù)據(jù)中心中所有服務(wù)器的流量入口,并以處理報(bào)文的方式處理數(shù)據(jù),在網(wǎng)絡(luò)芯片領(lǐng)域積累更多的廠商將更有優(yōu)勢(shì)。

a1fea060-a8df-11ed-bfe3-dac502259ad0.png

傳統(tǒng)的GPU在訪問(wèn)存儲(chǔ)時(shí),需要將數(shù)據(jù)先搬移到系統(tǒng)內(nèi)存,再由系統(tǒng)內(nèi)存搬移到目標(biāo)設(shè)備。而采用DPU介入后可以繞過(guò)CPU,直接通過(guò)PCIe訪問(wèn)遠(yuǎn)端的NVMe設(shè)備,加速AI訓(xùn)練,大大降低CPU的開(kāi)銷。

在AI/ML領(lǐng)域的工作負(fù)載對(duì)于存儲(chǔ)系統(tǒng)的要求十分苛刻,目前此類應(yīng)用已主要采用全閃存存儲(chǔ),其中NVMe全閃存逐漸成為主流趨勢(shì)。同時(shí)存儲(chǔ)與前端應(yīng)用主機(jī)的網(wǎng)絡(luò)存儲(chǔ)協(xié)議開(kāi)始采用NVMe over Fabrics(NVMe-oF)。

NVMe-oF是一種存儲(chǔ)網(wǎng)絡(luò)協(xié)議,通過(guò)網(wǎng)絡(luò)將NVMe命令傳送到遠(yuǎn)程N(yùn)VMe子系統(tǒng),以利用NVMe 全閃存的并行訪問(wèn)和低延遲,該規(guī)范定義了一個(gè)協(xié)議接口,旨在與高性能fabric技術(shù)配合使用,包括通過(guò)實(shí)現(xiàn)RDMA技術(shù)的InfiniBand、RoCE v2、iWARP或TCP。

NVMe-oF是一種使用NVMe協(xié)議將訪問(wèn)擴(kuò)展到遠(yuǎn)程存儲(chǔ)系統(tǒng)的非易失性存儲(chǔ)器(NVM)設(shè)備的方法。這使得前端接口能夠連接到存儲(chǔ)系統(tǒng)中,擴(kuò)展到大量NVMe設(shè)備,并延長(zhǎng)數(shù)據(jù)中心內(nèi)可以訪問(wèn)NVMe子系統(tǒng)的距離。NVMe-oF的目標(biāo)是顯著改善數(shù)據(jù)中心網(wǎng)絡(luò)延遲,并為遠(yuǎn)程N(yùn)VMe設(shè)備提供近似于本地訪問(wèn)的延遲,目標(biāo)為10us。

我們知道AI對(duì)計(jì)算的需求非常大,目前主流的AI加速還是以GPU、FPGA和一些專門的AI芯片等為主。在GPU、AI芯片用于AI計(jì)算之前都是CPU承擔(dān)計(jì)算的任務(wù),CPU的效率難以滿足需求,從而產(chǎn)生CPU+GPU+ASIC的異構(gòu)計(jì)算。隨著DPU的出現(xiàn),這種異構(gòu)計(jì)算的發(fā)展更加徹底,可以更大提供并行處理能力,適合大規(guī)模計(jì)算的發(fā)展。

a217cd2e-a8df-11ed-bfe3-dac502259ad0.png

支持Chiplet技術(shù)的超異構(gòu)算力芯片,伴隨著AI/ML的發(fā)展將會(huì)得到更好的應(yīng)用,而支持Die-To-Die互聯(lián)技術(shù)將能夠提供互聯(lián)其他AI芯片和算力單元的巨大能力,擺脫一直以來(lái)PCIe發(fā)展的限制。 ??拿芯啟源自身舉例,以支持高級(jí)AI為主要目標(biāo)之一的芯啟源最新的DPU芯片,其架構(gòu)中就應(yīng)用Chiplet技術(shù)。不僅提升了自有智能網(wǎng)卡的性能,通過(guò)支持與第三方芯片的Die-To-Die互聯(lián),還可以集成更多的特定專業(yè)領(lǐng)域的芯片,比如AI訓(xùn)練中的GPU芯片。

雖然PCIe非常的標(biāo)準(zhǔn),但是帶寬非常有限的,PCIe Gen3的理論帶寬是32GB/s,PCIe Gen4的理論帶寬是64GB/s,而實(shí)測(cè)帶寬大概分別是24GB/s和48GB/s。

在AI訓(xùn)練中,每完成一輪計(jì)算,都要同步更新一次參數(shù),也就是權(quán)系數(shù)。模型規(guī)模越大,參數(shù)規(guī)模一般也會(huì)更大,這樣算力芯片的效率會(huì)收到PCIe架構(gòu)的限制,支持更高能力層次的互聯(lián)技術(shù)講徹底解決帶寬限制和瓶頸,極大提升單節(jié)點(diǎn)計(jì)算效率。

和ChatGPT聊了那么多,最后再讓我們來(lái)看看他/她對(duì)于DPU應(yīng)用了解多少呢?

a2a5aea0-a8df-11ed-bfe3-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    38121

    瀏覽量

    296699
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    407

    瀏覽量

    26210
  • chiplet
    +關(guān)注

    關(guān)注

    6

    文章

    482

    瀏覽量

    13504

原文標(biāo)題:爆紅智能AI如何看待DPU ChatGPT這樣說(shuō)

文章出處:【微信號(hào):corigine,微信公眾號(hào):芯啟源】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI智能眼鏡將達(dá)千萬(wàn)級(jí),這顆芯片提前火了!

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)自CES2025展上AI智能眼鏡大放異彩之后,業(yè)界普遍期待這一單品有望接棒TWS耳機(jī),成為又一款消費(fèi)電子產(chǎn)品。前有?Meta 公司與雷朋(Ray-Ban)品牌合作推出
    的頭像 發(fā)表于 02-24 07:48 ?4309次閱讀
    <b class='flag-5'>爆</b>品<b class='flag-5'>AI</b><b class='flag-5'>智能</b>眼鏡將達(dá)千萬(wàn)級(jí),這顆芯片提前火了!

    電子寵物“賣了”,網(wǎng)“摩突突”BOM成本僅20多元

    平臺(tái)數(shù)據(jù)顯示,三季度電子寵物品類成交額同比增幅超250%,其中帶智能交互功能的產(chǎn)品占比達(dá)72%。進(jìn)入“雙十一”購(gòu)物節(jié),這一熱度進(jìn)一步攀升,某品牌AI機(jī)器小狗預(yù)售量突破10萬(wàn)臺(tái),較去年同期增長(zhǎng)300%。在電子寵物“賣”的熱潮下,
    的頭像 發(fā)表于 11-09 03:11 ?5526次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務(wù)為 AI 數(shù)據(jù)存儲(chǔ)、網(wǎng)絡(luò)和安全帶來(lái)突破性的加速。
    的頭像 發(fā)表于 11-03 14:48 ?598次閱讀

    AI賦能6G與衛(wèi)星通信:開(kāi)啟智能天網(wǎng)新時(shí)代

    的\"天網(wǎng)\"更加智能、可靠和高效。 AI驅(qū)動(dòng)的網(wǎng)絡(luò)優(yōu)化:讓6G網(wǎng)絡(luò)\"聰明\"起來(lái) 想象一下,當(dāng)城市中突然出現(xiàn)大型活動(dòng),如體育賽事或音樂(lè)節(jié),6G網(wǎng)絡(luò)如何應(yīng)對(duì)激增的用戶
    發(fā)表于 10-11 16:01

    在學(xué)習(xí)D13的芯片配置,為什么我vscode,一堆,看著好煩,有沒(méi)有解決辦法

    在學(xué)習(xí)D13的芯片配置,為什么我vscode,一堆,看著好煩,有沒(méi)有解決辦法
    發(fā)表于 08-22 20:02

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開(kāi)發(fā)的新一代AI大模型。其核心優(yōu)勢(shì)在于強(qiáng)大的推理引擎能力,融合了自然語(yǔ)言處理(NLP)、深度
    發(fā)表于 07-16 15:29

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語(yǔ)音視覺(jué)識(shí)別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無(wú)需依賴網(wǎng)絡(luò)即可實(shí)現(xiàn)智能功能的特性,在一些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場(chǎng)景中,發(fā)揮著不可或缺的作用。本章基于CSK
    發(fā)表于 07-04 11:14

    達(dá)實(shí)智能如何看待行業(yè)的發(fā)展

    智能化行業(yè)發(fā)展如何?在行業(yè)深耕30載的達(dá)實(shí)智能如何看待行業(yè)的發(fā)展?全新系列“劉磅解碼智能化”已上線,達(dá)實(shí)智能董事長(zhǎng)劉磅將與大家分享
    的頭像 發(fā)表于 06-23 13:48 ?644次閱讀

    【解構(gòu)·AI玩具】從“小智AI”引爆開(kāi)發(fā)者熱潮說(shuō)起

    一、AI玩具火,“小智AI”引爆全民熱潮 在眾多AI硬件產(chǎn)品當(dāng)中,AI玩具曾長(zhǎng)期被視為邊緣品類,相較于滿足功能性需求的
    發(fā)表于 05-20 09:20 ?2049次閱讀
    【解構(gòu)·<b class='flag-5'>AI</b>玩具】從“小智<b class='flag-5'>AI</b>”引爆開(kāi)發(fā)者熱潮說(shuō)起

    又一個(gè)中國(guó)AI產(chǎn)品Manus刷屏 中國(guó)AI新星Manus火 全網(wǎng)搶邀請(qǐng)碼

    Manus 的 AI 產(chǎn)品在科技圈一夜火,全球首款通用智能體Manus開(kāi)啟內(nèi)測(cè)火,據(jù)說(shuō)現(xiàn)在很多的網(wǎng)友都在求Manus邀請(qǐng)碼。而Manus的
    的頭像 發(fā)表于 03-06 14:09 ?1616次閱讀

    AI賦能邊緣網(wǎng)關(guān):開(kāi)啟智能時(shí)代的新藍(lán)海

    在數(shù)字化轉(zhuǎn)型的浪潮中,AI與邊緣計(jì)算的結(jié)合正掀起一場(chǎng)深刻的產(chǎn)業(yè)變革。邊緣網(wǎng)關(guān)作為連接物理世界與數(shù)字世界的橋梁,在AI技術(shù)的加持下,正從簡(jiǎn)單的數(shù)據(jù)采集傳輸節(jié)點(diǎn),進(jìn)化為具備智能決策能力的邊緣計(jì)算單元
    發(fā)表于 02-15 11:41

    泰晶科技晶振在AI眼鏡中的應(yīng)用

    近年來(lái),隨著人工智能與增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)的深度融合,AI智能眼鏡正從科幻概念加速邁向消費(fèi)級(jí)市場(chǎng),成為繼智能手機(jī)之后最具潛力的下一代智能終端
    的頭像 發(fā)表于 02-14 16:18 ?1127次閱讀

    HarmonyOS NEXT 應(yīng)用開(kāi)發(fā)練習(xí):AI智能對(duì)話框

    一、練習(xí)內(nèi)容 在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO中,我們將使用ArkTS開(kāi)發(fā)語(yǔ)言創(chuàng)建一個(gè)功能更為豐富的AI智能對(duì)話框。這個(gè)對(duì)話框不僅具備基本的聊天功能,還能展示圖片消息、表情符號(hào),并
    發(fā)表于 01-03 11:29

    AI智能網(wǎng)卡在AI網(wǎng)絡(luò)中的作用

    寫在開(kāi)頭,本文主要介紹智能網(wǎng)卡在AI網(wǎng)絡(luò)的作用并在一定場(chǎng)景下說(shuō)明DPU智能網(wǎng)卡在功能上的一些區(qū)別以理解兩者的相似點(diǎn)和不同點(diǎn)。
    的頭像 發(fā)表于 12-18 16:17 ?2386次閱讀