chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算力積木+3D堆疊!GPNPU架構(gòu)創(chuàng)新,應(yīng)對(duì)AI推理需求

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2025-12-11 08:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2025年,人工智能正式邁入應(yīng)用推理時(shí)代。大模型從實(shí)驗(yàn)室走向千行百業(yè),推理需求呈指數(shù)級(jí)爆發(fā)。然而,高昂的推理成本與有限的算力供給之間的矛盾日益凸顯,成為制約AI規(guī)模化落地的關(guān)鍵瓶頸。在此背景下,云天勵(lì)飛推出其第五代芯片架構(gòu)——GPNPU(General-Purpose Neural Processing Unit,通用神經(jīng)網(wǎng)絡(luò)處理單元),以一場(chǎng)底層架構(gòu)的革命,試圖重塑AI算力格局,推動(dòng)大模型推理走向極致性價(jià)比時(shí)代。

GPNPU的核心定位是:做推理時(shí)代的優(yōu)等生。它摒棄了傳統(tǒng)芯片追求大而全的通用計(jì)算思路,轉(zhuǎn)而聚焦大模型推理的核心場(chǎng)景,如Prefill準(zhǔn)備階段和Decode生成階段,進(jìn)行深度定制與優(yōu)化。其目標(biāo)極具挑戰(zhàn)性:將當(dāng)前約1美元/百萬(wàn)Token的推理成本,壓縮至僅需1美分/百萬(wàn)Token,實(shí)現(xiàn)百倍效率提升。

GPNPU的黑科技源于三大底層創(chuàng)新。首先是算力積木設(shè)計(jì)思想。傳統(tǒng)芯片往往一刀切,難以兼顧云、邊、端多樣化的部署需求。GPNPU采用模塊化架構(gòu),如同樂(lè)高積木般可靈活堆疊,實(shí)現(xiàn)一次流片、多規(guī)格輸出。其算力覆蓋從8T到256T,既能支撐云端大模型推理,也能賦能邊緣設(shè)備與終端智能體,如機(jī)器人手機(jī)、AR眼鏡,真正實(shí)現(xiàn)全場(chǎng)景覆蓋。

其次,GPNPU采用3D堆疊存儲(chǔ)技術(shù),直面內(nèi)存墻難題。大模型推理對(duì)帶寬極為敏感,數(shù)據(jù)搬運(yùn)速度常成為性能瓶頸。通過(guò)3D堆疊,GPNPU大幅提升存儲(chǔ)密度與帶寬利用率,讓計(jì)算單元得以持續(xù)滿血運(yùn)行,顯著提升能效比。

第三,GPNPU實(shí)現(xiàn)異構(gòu)化與靈活調(diào)度。它深刻洞察到推理任務(wù)的動(dòng)態(tài)特性:Prefill階段重算力,Decode階段重帶寬。因此,通過(guò)軟硬協(xié)同優(yōu)化,GPNPU可動(dòng)態(tài)調(diào)整算力、帶寬與存儲(chǔ)的配比,不再依賴單一芯片硬扛,而是以靈活架構(gòu)適配任務(wù)變化,實(shí)現(xiàn)資源最優(yōu)利用。

與傳統(tǒng)架構(gòu)相比,GPNPU展現(xiàn)出顯著差異化優(yōu)勢(shì)。傳統(tǒng)GPU雖生態(tài)成熟、通用性強(qiáng),但推理成本高昂;傳統(tǒng)NPU能效較高,但多聚焦終端推理,通用性受限。而GPNPU則兼具GPU的通用性與NPU的高能效,專為大模型推理優(yōu)化,覆蓋端、邊、云全場(chǎng)景,并以算力積木實(shí)現(xiàn)前所未有的架構(gòu)靈活性,真正實(shí)現(xiàn)極致性價(jià)比。

目前,基于GPNPU架構(gòu)的芯片正加速落地。正在研發(fā)的Nova 500系列,作為第五代GPNPU芯片,重點(diǎn)提升帶寬與能效,是實(shí)現(xiàn)“1元內(nèi)搞定百萬(wàn)Token”目標(biāo)的關(guān)鍵一步。展望未來(lái),Nova 600系列將探索光電一體化互聯(lián),構(gòu)建高性價(jià)比的算力網(wǎng)絡(luò),進(jìn)一步將推理成本推向分級(jí)成本新低。

依托GPNPU,云天勵(lì)飛已構(gòu)建“深穹”(云端)、“深界”(邊緣)、“深擎”(具身智能)三大芯片產(chǎn)品矩陣,全面服務(wù)于互聯(lián)網(wǎng)大廠、智能終端廠商與機(jī)器人企業(yè),推動(dòng)AI應(yīng)用的廣泛落地。

在國(guó)產(chǎn)工藝受限、高端GPU供應(yīng)不確定的現(xiàn)實(shí)下,云天勵(lì)飛沒(méi)有選擇在制程工藝上硬拼,而是以架構(gòu)創(chuàng)新另辟蹊徑。GPNPU不僅是技術(shù)的突破,更是一種戰(zhàn)略智慧的體現(xiàn)——通過(guò)“算力積木+3D堆疊”的創(chuàng)新路徑,走出一條高能效、低成本、全場(chǎng)景的差異化發(fā)展之路。它預(yù)示著,AI算力將不再昂貴稀缺,而是如水電般普惠,真正賦能千行百業(yè)的智能化變革。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39144

    瀏覽量

    299810
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    端側(cè)AI堆疊DRAM”技術(shù),這些國(guó)內(nèi)廠商發(fā)!

    3D DRAM等定制化存儲(chǔ)方案正是基于利基存儲(chǔ)和先進(jìn)封裝,以近存計(jì)算的方式滿足AI推理的存儲(chǔ)需求。SoC廠商、下游終端廠商都在積極適配這一類新型存儲(chǔ)。 ? 華邦電子CUBE ? 華邦
    的頭像 發(fā)表于 09-08 06:05 ?1.2w次閱讀
    端側(cè)<b class='flag-5'>AI</b>“<b class='flag-5'>堆疊</b>DRAM”技術(shù),這些國(guó)內(nèi)廠商發(fā)<b class='flag-5'>力</b>!

    應(yīng)對(duì)端側(cè)AI、內(nèi)存、功耗“三堵墻”困境,安謀科技Arm China “周易”X3給出技術(shù)錦囊

    NPU IP,通過(guò)架構(gòu)創(chuàng)新、軟硬件協(xié)同優(yōu)化與開(kāi)放生態(tài)等,為應(yīng)對(duì)端側(cè)AI墻”、“內(nèi)存墻”、
    的頭像 發(fā)表于 12-18 13:45 ?321次閱讀
    <b class='flag-5'>應(yīng)對(duì)</b>端側(cè)<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>、內(nèi)存、功耗“三堵墻”困境,安謀科技Arm China “周易”X<b class='flag-5'>3</b>給出技術(shù)錦囊

    硅芯科技:AI突破,新型堆疊EDA工具持續(xù)進(jìn)化

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)先進(jìn)封裝是突破危機(jī)的核心路徑。2.5D/3D Chiplet異構(gòu)集成可破解內(nèi)存墻、功耗墻與面積墻,但面臨多物理場(chǎng)分析、測(cè)試容錯(cuò)等EDA設(shè)計(jì)挑戰(zhàn)?,F(xiàn)有E
    的頭像 發(fā)表于 10-31 09:16 ?1.2w次閱讀
    硅芯科技:<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>突破,新型<b class='flag-5'>堆疊</b>EDA工具持續(xù)進(jìn)化

    國(guó)產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    反而壓到了310W。更有意思的是它的異構(gòu)架構(gòu):NPU+CPU+DVPP的組合,居然能同時(shí)扛住訓(xùn)練和推理場(chǎng)景,之前做自動(dòng)駕駛算法時(shí),用它跑模型時(shí)延直接降了20%。 但疑惑也有:這種
    發(fā)表于 10-27 13:12

    什么是AI模組?

    未來(lái),騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動(dòng)AI邊緣計(jì)算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷演進(jìn)和物聯(lián)網(wǎng)應(yīng)用的持續(xù)拓展,騰視科技的
    的頭像 發(fā)表于 09-19 15:26 ?1363次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    什么是AI模組?

    未來(lái),騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動(dòng)AI邊緣計(jì)算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷演進(jìn)和物聯(lián)網(wǎng)應(yīng)用的持續(xù)拓展,騰視科技的
    的頭像 發(fā)表于 09-19 15:25 ?671次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    能力 2)內(nèi)存帶寬 3)邊緣設(shè)備的AI 2、架構(gòu)與形態(tài) 1)AGI芯片的基本架構(gòu) 設(shè)計(jì)AGI
    發(fā)表于 09-18 15:31

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    北京2025年7月30日 /美通社/ -- 近日,北京積科技有限公司(以下簡(jiǎn)稱"積科技")宣布其服務(wù)平臺(tái)上線赤兔推理引擎。積
    的頭像 發(fā)表于 07-30 21:44 ?826次閱讀

    革命:RoCE實(shí)測(cè)推理時(shí)延比InfiniBand低30%的底層邏輯

    AI 訓(xùn)練與推理中的網(wǎng)絡(luò)效率瓶頸,助力數(shù)據(jù)中心在高帶寬、低延遲、高可靠性的需求下實(shí)現(xiàn)資源的最優(yōu)配置。
    的頭像 發(fā)表于 05-28 14:08 ?1987次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>革命:RoCE實(shí)測(cè)<b class='flag-5'>推理</b>時(shí)延比InfiniBand低30%的底層邏輯

    AI原生架構(gòu)升級(jí):RAKsmart服務(wù)器在超大規(guī)模模型訓(xùn)練中的突破

    近年來(lái),隨著千億級(jí)參數(shù)模型的崛起,AI訓(xùn)練對(duì)需求呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。傳統(tǒng)服務(wù)器架構(gòu)應(yīng)對(duì)分布式
    的頭像 發(fā)表于 04-24 09:27 ?709次閱讀

    RAKsmart服務(wù)器如何重塑AI高并發(fā)格局

    AI大模型參數(shù)量突破萬(wàn)億級(jí)、實(shí)時(shí)推理需求激增的當(dāng)下,傳統(tǒng)服務(wù)器架構(gòu)的并發(fā)處理能力已逼近物理極限。RAKsmart通過(guò)“硬件重構(gòu)+軟件定義”的雙引擎
    的頭像 發(fā)表于 04-03 10:37 ?812次閱讀

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長(zhǎng)。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對(duì)
    發(fā)表于 03-25 12:00

    Marvell展示2納米芯片3D堆疊技術(shù),應(yīng)對(duì)設(shè)計(jì)復(fù)雜性挑戰(zhàn)!

    隨著現(xiàn)代科技的迅猛發(fā)展,芯片設(shè)計(jì)面臨著前所未有的挑戰(zhàn)。特別是在集成電路(IC)領(lǐng)域,隨著設(shè)計(jì)復(fù)雜性的增加,傳統(tǒng)的光罩尺寸已經(jīng)成為制約芯片性能和功能擴(kuò)展的瓶頸。為了解決這一問(wèn)題,3D堆疊技術(shù)應(yīng)運(yùn)而生
    的頭像 發(fā)表于 03-07 11:11 ?1037次閱讀
    Marvell展示2納米芯片<b class='flag-5'>3D</b><b class='flag-5'>堆疊</b>技術(shù),<b class='flag-5'>應(yīng)對(duì)</b>設(shè)計(jì)復(fù)雜性挑戰(zhàn)!

    AI需求激增,數(shù)據(jù)中心如何應(yīng)對(duì)能源挑戰(zhàn)

    ? “AI的爆發(fā)帶來(lái)了巨大的需求,為了滿足AI大模型的訓(xùn)練和應(yīng)用推理,智
    的頭像 發(fā)表于 02-22 09:49 ?1250次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>需求</b>激增,數(shù)據(jù)中心如何<b class='flag-5'>應(yīng)對(duì)</b>能源挑戰(zhàn)

    不再是HBM,AI推理流行,HBF存儲(chǔ)的機(jī)會(huì)來(lái)了?

    NAND閃存和高帶寬存儲(chǔ)器(HBM)的特性,能更好地滿足AI推理需求。 ? HBF的堆疊設(shè)計(jì)類似于HBM,通過(guò)硅通孔(TSVs)將多個(gè)高性能閃存核心芯片
    的頭像 發(fā)表于 02-19 00:51 ?4839次閱讀
    不再是HBM,<b class='flag-5'>AI</b><b class='flag-5'>推理</b>流行,HBF存儲(chǔ)的機(jī)會(huì)來(lái)了?