chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

堪稱史上最強(qiáng)推理芯片!英偉達(dá)發(fā)布 Rubin CPX,實(shí)現(xiàn)50倍ROI

? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:梁浩斌 ? 2025-09-11 08:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)近日,英偉達(dá)AI infra峰會(huì)上發(fā)布了專為大規(guī)模上下文推理設(shè)計(jì)的全新GPU系列Rubin CPX,性能堪稱炸裂!

英偉達(dá)創(chuàng)始人兼CEO黃仁勛表示,“正如 RTX 革新了圖形技術(shù)與物理 AI,Rubin CPX 則是首款專為大規(guī)模上下文 AI 設(shè)計(jì)的 CUDA GPU—— 在該場(chǎng)景下,模型可一次性基于數(shù)百萬(wàn)個(gè)token進(jìn)行推理。”

作為基于Rubin架構(gòu)的一款A(yù)I芯片,Rubin CPX采用了成本效益極高的單芯片設(shè)計(jì),集成強(qiáng)大的NVFP4計(jì)算資源,其GPU專為AI推理任務(wù)優(yōu)化,可以實(shí)現(xiàn)極高的性能和能效比。按照英偉達(dá)的說(shuō)法,Rubin CPX平臺(tái)可實(shí)現(xiàn) 30 至 50 倍的投資回報(bào)率(ROI),這意味著1億美元的資本性支出(CAPEX)投入,能帶來(lái)高達(dá)50億美元的收入,又呼應(yīng)了老黃此前的名言“買得越多賺得越多”,這不是新一代“印鈔機(jī)”嗎?

那么Rubin CPX是怎么實(shí)現(xiàn)高效AI推理的?

為什么需要Rubin CPX?

要理解Rubin CPX的作用,首先要知道分布式推理的架構(gòu)原理。

AI推理過(guò)程包含兩個(gè)截然不同的階段:上下文階段與生成階段,這兩個(gè)階段對(duì)AI基礎(chǔ)設(shè)施的需求存在本質(zhì)差異。其中,上下文階段受計(jì)算能力限制,需要通過(guò)高吞吐量處理來(lái)接收并分析大量輸入數(shù)據(jù),進(jìn)而生成首個(gè)token輸出結(jié)果。

與之不同的是,生成階段受內(nèi)存帶寬限制,需依賴高速內(nèi)存?zhèn)鬏敿癗VLink等高速互聯(lián)方案,以維持逐推理單元(token-by-token)的輸出性能。
wKgZPGjCF4eACLVlAALDbq26KqU125.png
為了提高計(jì)算效率,英偉達(dá)通過(guò)分布式推理可以實(shí)現(xiàn)這兩個(gè)階段的獨(dú)立處理,從而對(duì)計(jì)算和內(nèi)存資源進(jìn)行針對(duì)性優(yōu)化。這一架構(gòu)變革能夠提升吞吐量、降低延遲,并提高整體資源利用率。

具體來(lái)說(shuō),分布式推理的流程是,文檔 / 數(shù)據(jù)庫(kù) / 視頻等數(shù)據(jù)輸入至上下文處理器;其輸出會(huì)傳輸至鍵值緩存(KV 緩存),供 GPU B 生成節(jié)點(diǎn)讀取以生成結(jié)果。GPU A 針對(duì)長(zhǎng)上下文處理進(jìn)行了優(yōu)化,而 GPU B 則在上下文階段與生成階段均能實(shí)現(xiàn)出色的總擁有成本表現(xiàn)。

然而,分布式架構(gòu)也帶來(lái)了新的復(fù)雜性層級(jí),需要在低延遲 KV 緩存?zhèn)鬏?、大語(yǔ)言模型感知路由(LLM-aware Routing)及高效內(nèi)存管理之間實(shí)現(xiàn)精準(zhǔn)協(xié)同。英偉達(dá) Dynamo可作為這些組件的編排層,其功能在最新的 MLPerf 推理基準(zhǔn)測(cè)試結(jié)果中發(fā)揮了關(guān)鍵作用。

而分布式推理要發(fā)揮出其優(yōu)勢(shì),在上下文處理階段的效率提升尤為重要。Rubin CPX GPU就是專為解決這個(gè)階段的計(jì)算效率的一種解決方案,目標(biāo)是為高價(jià)值長(zhǎng)上下文推理工作負(fù)載提供高吞吐量性能,同時(shí)可無(wú)縫集成至分布式基礎(chǔ)設(shè)施中。

Vera Rubin NVL144 CPX平臺(tái):GB300 NVL72的7.5倍性能

Rubin CPX 具備30 petaFLOPs的NVFP4計(jì)算能力、128 GB的GDDR7內(nèi)存、硬件級(jí)別的視頻解碼/編碼支持,以及三倍于NVIDIA GB300的注意力機(jī)制加速性能。

比如處理視頻時(shí),AI模型每處理1小時(shí)的內(nèi)容可能需要多達(dá)100 萬(wàn)個(gè)token,這突破了傳統(tǒng) GPU的計(jì)算極限。Rubin CPX在單芯片中集成了視頻解碼器與編碼器,以及長(zhǎng)上下文推理處理功能,從而在視頻搜索、高質(zhì)量生成式視頻等長(zhǎng)時(shí)長(zhǎng)應(yīng)用場(chǎng)景中,實(shí)現(xiàn)了前所未有的性能。

同時(shí),英偉達(dá)也推出了一套集成Rubin CPX 、NVIDIA Vera CPU、Rubin GPU的完整高性能分布式服務(wù)解決方案——NVIDIA Vera Rubin NVL144 CPX。
wKgZPGjCF4-AP-1FAAWI2Pk6d8c213.png?
Vera Rubin NVL144 CPX 圖源:英偉達(dá)

NVIDIA Vera Rubin NVL144 CPX機(jī)架集成144個(gè)Rubin CPX GPU、144個(gè)Rubin GPU 以及36個(gè) Vera CPU,能夠?qū)崿F(xiàn)8 exaFLOPs的NVFP4計(jì)算性能,是GB300 NVL72的7.5倍,同時(shí)還提供100 TB的高速內(nèi)存和高達(dá)1.7 PB/s的內(nèi)存帶寬。

Vera Rubin NVL144 CPX采用了NVIDIA Quantum-X800 InfiniBand或Spectrum-X以太網(wǎng)技術(shù),與NVIDIA ConnectX-9 SuperNIC配合使用,并由Dynamo平臺(tái)進(jìn)行管理。英偉達(dá)表示,在規(guī)模化應(yīng)用中,該平臺(tái)能夠?qū)崿F(xiàn)30至50倍的投資回報(bào)。
wKgZO2jCF5eAXD_aAAdPDNw4qLo783.png
值得一提的是,對(duì)于已經(jīng)訂購(gòu)Vera Rubin NVL144系統(tǒng)的用戶,英偉達(dá)也提供專用的Rubin CPX 計(jì)算托盤,可以在現(xiàn)有的Vera Rubin NVL144系統(tǒng)上拓展推理能力。

根據(jù)此前英偉達(dá)的上市時(shí)間表,Rubin架構(gòu)GPU預(yù)計(jì)在2026年正式上市,預(yù)計(jì)在今年9月交付客戶測(cè)試。而同為Rubin架構(gòu)的Rubin CPX GPU,英偉達(dá)預(yù)計(jì)會(huì)在2026年下半年上市,Vera Rubin NVL144 CPX則預(yù)計(jì)在2026年底上市。

近日英偉達(dá)宣布,年度技術(shù)大會(huì)GTC2026將會(huì)在2026年3月16日至19日舉行,預(yù)計(jì)在大會(huì)上將正式推出Rubin GPU和Vera CPU兩大產(chǎn)品。

寫在最后

Rubin CPX的推出,可以說(shuō)是AI推理側(cè)的一顆“重磅炸彈”。正如黃仁勛提到的“Rubin CPX 是 AI 推理領(lǐng)域的 RTX”,AI算力硬件正在通過(guò)細(xì)分場(chǎng)景的優(yōu)化,實(shí)現(xiàn)革命性的效率提升。同時(shí)借助Rubin CPX,英偉達(dá)開(kāi)拓了算力硬件的新形式,占領(lǐng)長(zhǎng)上下文推理領(lǐng)域的“無(wú)人區(qū)”。在視頻、代碼生成等用到巨量Token的領(lǐng)域,未來(lái)Rubin CPX可能會(huì)占據(jù)極為有利的生態(tài)位,繼續(xù)筑牢英偉達(dá)在AI基建市場(chǎng)的護(hù)城河。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5035

    瀏覽量

    133738
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4014

    瀏覽量

    96795
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    揭曉英偉達(dá)最強(qiáng)芯片!Blackwell Ultra、Rubin芯片亮相,新機(jī)器人壓軸

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)北京時(shí)間3月19日晚間,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在2025年GTC開(kāi)發(fā)者大會(huì)上發(fā)表了主題演講,介紹了英偉達(dá)在AI、機(jī)器人、加速計(jì)算等領(lǐng)域的最新進(jìn)展,包括
    的頭像 發(fā)表于 03-19 09:05 ?2824次閱讀
    揭曉<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>最強(qiáng)</b><b class='flag-5'>芯片</b>!Blackwell Ultra、<b class='flag-5'>Rubin</b><b class='flag-5'>芯片</b>亮相,新機(jī)器人壓軸

    英偉達(dá)黃仁勛:我們要做巨型芯片!最強(qiáng)顯卡RTX 5090發(fā)布,汽車芯片Thor算力翻20

    50 系列、AI大模型、AI機(jī)器人、超小型AI超級(jí)計(jì)算機(jī),以及英偉達(dá)的終極目標(biāo):名為Grace Blackwell NVLink72的巨型芯片等。 ? 下面提煉一些關(guān)鍵信息: ? 關(guān)
    的頭像 發(fā)表于 01-08 08:59 ?4395次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>黃仁勛:我們要做巨型<b class='flag-5'>芯片</b>!<b class='flag-5'>最強(qiáng)</b>顯卡RTX 5090<b class='flag-5'>發(fā)布</b>,汽車<b class='flag-5'>芯片</b>Thor算力翻20<b class='flag-5'>倍</b>

    英偉達(dá)下一代Rubin芯片已流片

    繼8月底英偉達(dá)透露Rubin架構(gòu)芯片計(jì)劃明年量產(chǎn)后,當(dāng)?shù)貢r(shí)間9月8日的高盛技術(shù)會(huì)議上,英偉達(dá)又談
    的頭像 發(fā)表于 09-12 17:15 ?810次閱讀

    較GB300提升6.5英偉達(dá)發(fā)布最強(qiáng)推理芯片系統(tǒng)

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年09月10日 16:21:41

    英偉達(dá)自研HBM基礎(chǔ)裸片

    電子發(fā)燒友網(wǎng)綜合報(bào)道,據(jù)臺(tái)媒消息,傳聞英偉達(dá)已開(kāi)始開(kāi)發(fā)自己的HBM基礎(chǔ)裸片,預(yù)計(jì)英偉達(dá)的自研HBM基礎(chǔ)裸片采用3nm工藝制造,計(jì)劃在2027年下半年進(jìn)行小批量試產(chǎn)。并且這一時(shí)間點(diǎn)大致對(duì)
    的頭像 發(fā)表于 08-21 08:16 ?2334次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代
    的頭像 發(fā)表于 03-20 15:35 ?1067次閱讀

    新思科技攜手英偉達(dá)加速芯片設(shè)計(jì),提升芯片電子設(shè)計(jì)自動(dòng)化效率

    解決方案在英偉達(dá) GPU和英偉達(dá) CUDA-X庫(kù)上所實(shí)現(xiàn)的加速 基于英偉
    發(fā)表于 03-19 17:59 ?358次閱讀

    英偉達(dá)市值一夜蒸發(fā)近2萬(wàn)億 英偉達(dá)股價(jià)下跌超8%

    財(cái)年第四財(cái)季和全財(cái)年業(yè)績(jī)數(shù)據(jù)上看,2025財(cái)年第四財(cái)季及全年的營(yíng)收和利潤(rùn)都實(shí)現(xiàn)了大幅增長(zhǎng),大家特別關(guān)注的數(shù)據(jù)中心業(yè)務(wù)也是業(yè)績(jī)?cè)鲩L(zhǎng)的核心動(dòng)力,展現(xiàn)出英偉達(dá)在AI領(lǐng)域的強(qiáng)大實(shí)力。而且英偉
    的頭像 發(fā)表于 03-04 10:19 ?862次閱讀

    英偉達(dá)RTX 50系列顯卡面臨供應(yīng)瓶頸

    近日,天風(fēng)國(guó)際知名分析師郭明錤發(fā)布了一份最新報(bào)告,揭示了英偉達(dá)新一代GeForce RTX 50系列顯卡當(dāng)前面臨的嚴(yán)峻挑戰(zhàn)。據(jù)報(bào)告指出,該系列顯卡正遭遇核心
    的頭像 發(fā)表于 02-14 09:22 ?987次閱讀

    英偉達(dá)發(fā)布DeepSeek R1于NIM平臺(tái)

    網(wǎng)站上發(fā)布。 據(jù)悉,DeepSeek R1 NIM微服務(wù)是英偉達(dá)在人工智能領(lǐng)域的一項(xiàng)重要?jiǎng)?chuàng)新,旨在為用戶提供高效、精準(zhǔn)的推理服務(wù)。在單個(gè)英偉
    的頭像 發(fā)表于 02-05 14:48 ?820次閱讀

    軟銀攜手英偉達(dá)打造日本最強(qiáng)AI超算

    軟銀集團(tuán)近日宣布,將率先采用英偉達(dá)最新的Blackwell平臺(tái),打造日本最強(qiáng)的AI超級(jí)計(jì)算機(jī)。此舉旨在滿足日本在人工智能領(lǐng)域快速發(fā)展的迫切需求,推動(dòng)國(guó)內(nèi)AI技術(shù)的創(chuàng)新與應(yīng)用。
    的頭像 發(fā)表于 11-14 16:25 ?788次閱讀

    英偉達(dá)加速Rubin平臺(tái)AI芯片推出,SK海力士提前交付HBM4存儲(chǔ)器

    日,英偉達(dá)(NVIDIA)的主要高帶寬存儲(chǔ)器(HBM)供應(yīng)商南韓SK集團(tuán)會(huì)長(zhǎng)崔泰源透露,英偉達(dá)執(zhí)行長(zhǎng)黃仁勛已要求SK海力士提前六個(gè)月交付用于英偉
    的頭像 發(fā)表于 11-05 14:22 ?1693次閱讀

    英偉達(dá)地表最強(qiáng)AI芯片GB200 NVL72服務(wù)器遭搶購(gòu)

    10月28日,最新媒體報(bào)道顯示,配備有英偉達(dá)被譽(yù)為“地表最強(qiáng)AI芯片”的GB200的AI服務(wù)器已開(kāi)始交付,微軟、Meta等行業(yè)巨頭正積極擴(kuò)大采購(gòu)更高端的NVL72型號(hào)服務(wù)器。
    的頭像 發(fā)表于 10-29 10:42 ?1977次閱讀

    英偉達(dá)市值飆升,逼近蘋果

    近日,隨著人工智能技術(shù)的持續(xù)繁榮,英偉達(dá)公司作為AI芯片生產(chǎn)的領(lǐng)軍者,其市值實(shí)現(xiàn)了驚人的飛躍。截至美國(guó)當(dāng)?shù)貢r(shí)間21日,英偉
    的頭像 發(fā)表于 10-23 09:31 ?873次閱讀