chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百億Token一分錢!云天勵飛喊出“推理成本萬倍降”,公布三年三芯路線圖

Monika觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:莫婷婷 ? 2026-02-09 14:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/莫婷婷)當前,全球人工智能邁入具身智能(Agentic AI)時代,云天勵飛董事長兼CEO陳寧博士在“大算力芯片戰(zhàn)略前瞻會”上強調:公司將聚焦大模型推理芯片。在大會上,云天勵飛闡述了GPNPU架構的技術內涵,并公開了未來三年大算力芯片路線圖,致力于成為“最懂AI的推理芯片領軍企業(yè)”。



GPNPU:打造中國版TPU的最優(yōu)解

自2025年起,AI推理芯片將迎來未來5至10年的高光時刻,核心驅動力在于大模型推理需求的爆發(fā)式增長——尤其是Token數(shù)量的指數(shù)級攀升。

以字節(jié)跳動的豆包為例:2024年5日均Token量僅為0.12萬億;到2025年9月,已飆升至30萬億;僅三個月后(2025年12月)便突破50萬億。按此每季度近翻倍的增速推算,當前日均Token量很可能已達70–80萬億。



大模型訓練與推理在計算范式上的根本差異:訓練追求算力絕對值、高精度和大規(guī)模集群互聯(lián),而推理則聚焦成本敏感、能效比與極致性價比。訓練芯片需要百萬卡級的高性能互聯(lián),依賴FP64/32/16等高精度計算,對成本不敏感;而推理場景——如手機上的豆包、耳機中的同聲傳譯、眼鏡里的智能助手——更關注每個Token背后的真實成本。

陳寧博士表示,云天勵飛將持續(xù)推進“百萬Token推理成本每年兩位數(shù)下降”的目標,力爭到2030年實現(xiàn)“百億Token僅需一分錢人民幣”,最終達成“推理算力平權”。

面對全球AI算力重心從訓練向推理遷移的歷史性拐點,云天勵飛指出“訓練追趕、推理超車”是公司未來五年的核心策略。2025年,云天勵飛提出其第五代芯片架構——GPNPU。
陳寧博士表示,GPNPU架構是大模型推理的最佳載體。

GPNPU是一套覆蓋硬件微架構、系統(tǒng)集成和軟件生態(tài)的綜合解決方案,其本質是“GPGPU + NPU + 3DM + 算力積木”四維融合,具備了通用性、高效性、大帶寬、低延時等特點,且采用了算力積木架構。

云天勵飛CTO李愛軍進一步介紹,GPNPU實現(xiàn)對CUDA兼容,支持“一行代碼遷移”;采用NPU級SIMD矩陣計算單元,實現(xiàn)單位面積更高的計算密度;該架構引入自研3D Memory堆疊架構,帶寬達HBM的10倍,有效破解“內存墻”瓶頸;通過3DM高效訪存架構實現(xiàn)10納秒級延遲,滿足實時交互類應用需求。

值得一提的是,云天勵飛在過去五年深耕國產(chǎn)工藝,率先探索了 Chiplet算力積木架構,而這一架構與當前大模型推理所需的超節(jié)點設計理念異曲同工。為此,公司定義下一代芯片的Scale-Up超節(jié)點架構,從而高效支撐萬億級乃至十萬億級MoE大模型的推理需求。云天勵飛也是國內少數(shù)掌握D2D Chiplet和C2C Mesh互連技術的企業(yè)之一。


李愛軍提到,GPNPU系統(tǒng)級芯片,相比當前主流以訓練為主的GPGPU架構,在推理效率、性能表現(xiàn)和成本控制方面均實現(xiàn)了顯著領先。更進一步的在Agent 時代,多模型、多智能體的自主多模型的推理時代,對于推理的時延到了毫秒級,這個時候我們的領先優(yōu)勢將會實現(xiàn)跨代的領先。

公布三年三芯路線圖

在發(fā)布會上,云天勵飛公布了未來三年大算力芯片規(guī)劃,以“PD分離 + AFN細粒度優(yōu)化 + 超節(jié)點集群”為核心設計理念,精準應對大模型推理中prefill(計算密集)與decode(訪存密集)階段的不同需求。

2025年:推出第一代超節(jié)點P芯片(DeepVerse 100),專注百萬長上下文場景的prefill推理,算力對標英偉達Hopper架構的H100;

2026年:發(fā)布第一代超節(jié)點D芯片(DeepVerse 200),聚焦超低延遲decode推理,性能看齊Blackwell架構的B200;

2027年:迭代至第二代超節(jié)點P芯片(DeepVerse 300),實現(xiàn)毫秒級端到端推理時延,算力目標直指英偉達下一代Rubin架構。



云天勵飛以大模型推理為核心應用場景,覆蓋大模型云推理、多模態(tài)理解等當前主流。云天勵飛透露,公司的產(chǎn)業(yè)也可以應用到深空探測領域,推進“算力進太空”,開啟AI航天新篇章。

目前,云天勵飛已構建多元化的生態(tài)布局,其客戶群體包括AI大模型企業(yè)、涵蓋互聯(lián)網(wǎng)大廠、科技領軍企業(yè)等行業(yè)頭部客戶,以及政企與基礎設施客戶。

可以看到,云天勵飛不僅擁有領先的技術,還具備強大的供應鏈韌性與交付能力。尤為值得關注的是,云天勵飛已成功實現(xiàn)全國產(chǎn)化工藝閉環(huán)。僅用五年時間,公司完成了從芯片設計、先進制造工藝到先進封裝的全鏈條自主可控,并推動全國產(chǎn)推理算力芯片持續(xù)迭代。

至今,云天勵飛已構建“1+4”組織架構,包括:

政企事業(yè)部:作為公司基石,聚焦智慧城市、交通、安防等領域,正在規(guī)劃建設區(qū)域級千卡智算集群,賦能城市級AI滲透;
嚕咔(Luka)事業(yè)部:打造面向兒童的AI原生硬件智能體,被內部稱為“Token吞金獸”,有望成為消費級爆品;
岍丞(Qiancheng)事業(yè)部:藍牙耳機模組年出貨超3200萬顆,占中國手機品牌35%以上份額,2026年將啟動自有AI C端品牌探索;
智算事業(yè)部:服務互聯(lián)網(wǎng)大廠與運營商,已斬獲16億大單,正與多家頭部客戶推進深度合作。

這四大事業(yè)部,讓云天勵飛形成從技術研發(fā)到市場落地的完整閉環(huán)。


小結

站在第四次工業(yè)革命的門檻上,云天勵飛正以GPNPU為支點,撬動中國在全球AI基礎設施格局中的新地位。在發(fā)布會上,云天勵飛強調,“到2030年,通過GPNPU推理架構的持續(xù)創(chuàng)新,堅定推進百萬Tokens推理成本萬倍降低,最終實現(xiàn)推理算力平權!”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39684

    瀏覽量

    301287
  • 云天勵飛
    +關注

    關注

    0

    文章

    182

    瀏覽量

    12649
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    全球唯?IBM更新量子計算路線圖:2029交付!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)近年來,量子計算似乎正在取得越來越多突破,國內外都涌現(xiàn)出不少的技術以及產(chǎn)品突破。作為量子計算領域的先驅之,IBM近日公布了其量子計算路線圖,宣布將在2029
    的頭像 發(fā)表于 06-15 00:01 ?9042次閱讀
    全球唯<b class='flag-5'>一</b>?IBM更新量子計算<b class='flag-5'>路線圖</b>:2029<b class='flag-5'>年</b>交付!

    云天正式舉辦大算力芯片戰(zhàn)略前瞻會

    2月3日,云天正式舉辦“大算力芯片戰(zhàn)略前瞻會”,首次對外公布未來三年的大算力 AI 推理芯片
    的頭像 發(fā)表于 02-06 17:23 ?3638次閱讀

    力爭百萬 Tokens 推理成本降低百云天發(fā)布未來三年大算力芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    2月3日,云天正式舉辦“大算力芯片戰(zhàn)略前瞻會”,首次對外公布未來三年的大算力 AI 推理芯片
    的頭像 發(fā)表于 02-03 20:25 ?1920次閱讀
    力爭百萬 Tokens <b class='flag-5'>推理成本</b>降低百<b class='flag-5'>倍</b>:<b class='flag-5'>云天</b><b class='flag-5'>勵</b><b class='flag-5'>飛</b>發(fā)布未來<b class='flag-5'>三年</b>大算力芯片戰(zhàn)略,首曝 DeepVerse <b class='flag-5'>路線圖</b>

    曦望發(fā)布新推理GPU芯片,單位Token推理成本降低90%

    已突破片。 ? 啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場景下,它的整體性價比較上代提升超10。在算力與存儲設計
    的頭像 發(fā)表于 01-28 17:38 ?8646次閱讀

    天數(shù)智重磅公布四代架構路線圖,對標英偉達

    電子發(fā)燒友綜合報道 1月26日,天數(shù)智“智啟程”合作伙伴大會盛大啟幕。會上,天數(shù)智不僅公布了四代架構路線圖,還發(fā)布了“彤央”邊端產(chǎn)品,
    的頭像 發(fā)表于 01-27 16:24 ?7808次閱讀
    天數(shù)智<b class='flag-5'>芯</b>重磅<b class='flag-5'>公布</b>四代架構<b class='flag-5'>路線圖</b>,對標英偉達

    云天與360集團簽署戰(zhàn)略合作協(xié)議

    12月22日,云天與360集團簽署戰(zhàn)略合作協(xié)議。雙方將圍繞“納米AI”算力底座建設、大模型安全能力提升以及智慧生活產(chǎn)品打造等方向,充分發(fā)揮各自在資源、場景與技術方面的優(yōu)勢,聯(lián)合打造國產(chǎn)生態(tài)下的AI
    的頭像 發(fā)表于 12-25 17:09 ?507次閱讀

    云天:AI推理需求狂飆,國產(chǎn)算力芯片機遇期加速到來

    今年來自國內外的半導體創(chuàng)新領袖企業(yè)高管們又帶來哪些前瞻觀點?此次,電子發(fā)燒友網(wǎng)特別采訪了云天,以下是這家公司對2026半導體產(chǎn)業(yè)的分析與展望。
    的頭像 發(fā)表于 12-23 10:13 ?1.1w次閱讀
    <b class='flag-5'>云天</b><b class='flag-5'>勵</b><b class='flag-5'>飛</b>:AI<b class='flag-5'>推理</b>需求狂飆,國產(chǎn)算力芯片機遇期加速到來

    云天中標AI龍崗期1.22億元項目

    日前,云天中標AI龍崗期1.22億元項目,將為龍崗區(qū)打造AI與機器人示范場景提供技術支撐,助力城市治理智能化水平持續(xù)提升。
    的頭像 發(fā)表于 12-22 09:34 ?402次閱讀

    云天AI推理芯片如何賦能千行百業(yè)

    11月26日,云天會客廳第二期生態(tài)沙龍暨深商聯(lián)高科技高成長創(chuàng)新營走進上市公司活動圓滿舉辦。來自深圳科技領域的多位企業(yè)負責人齊聚云天,共同探討AI
    的頭像 發(fā)表于 12-03 13:58 ?619次閱讀

    云天亮相2025中國具身智能機器人大會

    近日,在 2025 中國具身智能機器人大會上,云天副總裁羅憶從芯片廠商的視角出發(fā),對具身智能產(chǎn)業(yè)的未來進行了深入剖析,并分享了公司在 AI 推理芯片與機器人應用場景方面的整體布局。
    的頭像 發(fā)表于 11-25 11:26 ?845次閱讀

    云天與金蝶達成戰(zhàn)略合作

    11月4日,在2025金蝶全球創(chuàng)見者大會上,云天與金蝶簽署戰(zhàn)略合作協(xié)議。
    的頭像 發(fā)表于 11-05 18:09 ?1665次閱讀

    云天亮相2025灣區(qū)半導體產(chǎn)業(yè)生態(tài)博覽會

    在2025灣區(qū)半導體產(chǎn)業(yè)生態(tài)博覽會(灣展)上,云天以“算力積木”為核心理念,攜全棧AI推理產(chǎn)品體系重磅亮相,集中展示了從芯片到模組再到
    的頭像 發(fā)表于 10-16 17:45 ?997次閱讀

    云天正式加入OISA生態(tài)

    近日,云天正式加入 OISA 生態(tài),攜手產(chǎn)業(yè)伙伴共同推動國產(chǎn) AI 芯片互聯(lián)體系建設,為中國算力生態(tài)注入新的動力。
    的頭像 發(fā)表于 10-11 13:59 ?640次閱讀

    華為首次公布昇騰芯片新路線圖

    9月18日在上海世博中心舉辦的 2025 華為全聯(lián)接大會上,華為副董事長、輪值董事長徐直軍登臺發(fā)表演講,首次對外公布了昇騰 AI 芯片未來三年的產(chǎn)品迭代路線圖。這消息無疑為國內 AI
    的頭像 發(fā)表于 09-19 16:49 ?1714次閱讀
    華為首次<b class='flag-5'>公布</b>昇騰芯片新<b class='flag-5'>路線圖</b>

    云天亮相2025全球AI芯片峰會

    9 月 17 日,全球 AI 芯片峰會在上海舉行,云天董事長兼 CEO 陳寧出席并發(fā)表演講。
    的頭像 發(fā)表于 09-17 17:56 ?1363次閱讀