chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云天勵飛正式舉辦大算力芯片戰(zhàn)略前瞻會

云天勵飛 ? 來源:云天勵飛 ? 2026-02-06 17:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2月3日,云天勵飛正式舉辦“大算力芯片戰(zhàn)略前瞻會”,首次對外公布未來三年的大算力 AI 推理芯片戰(zhàn)略布局。

會上,云天勵飛提出“訓練追趕、推理超車”的戰(zhàn)略方向,并發(fā)布了基于“PD 分離”思路的芯片路線圖:力爭實現(xiàn)百萬 Tokens 推理成本降低 100 倍以上的目標,推動 AI 從技術(shù)嘗鮮走向普惠生產(chǎn)力。

戰(zhàn)略方向:訓練追趕,推理超車

云天勵飛董事長兼 CEO 陳寧博士在會上指出,訓練芯片與推理芯片在算力需求上存在顯著差異。訓練芯片更側(cè)重“絕對值”,對算力規(guī)模、帶寬能力以及科學計算的復雜精度要求更高,且對成本相對不敏感;推理芯片的核心考量則在于成本、效率與市場經(jīng)濟學,關(guān)鍵在于每一個 Token 背后的邊際成本與整體性價比。

陳寧表示,公司致力于持續(xù)降低百萬 Token 的成本,目標是通過下一代芯片實現(xiàn)“百萬 Tokens 一分錢”。未來三年,公司希望將成本進一步降至“百萬 Tokens 0.1分錢”,以加速大模型應用的規(guī)?;涞亍?/p>

對于未來五年的中國芯片產(chǎn)業(yè)發(fā)展,陳寧提出“訓練追趕、推理超車”的策略:在訓練芯片領(lǐng)域,目標是持續(xù)追趕,盡量保持差距不被拉大;而在推理芯片領(lǐng)域,依托中國豐富的應用場景、強大的基礎(chǔ)設(shè)施能力以及開源模型生態(tài),有機會實現(xiàn)突破與超車。

基于“PD 分離”架構(gòu),三年規(guī)劃三代芯片

針對大模型時代云推理場景的需求,云天勵飛 CTO 李愛軍在會上介紹了公司的技術(shù)解構(gòu)與路線圖。

他表示,云天勵飛將全力投入云推理場景的大算力芯片研發(fā),基于對大模型推理計算特征的理解,按照“PD 分離”的系統(tǒng)架構(gòu)規(guī)劃兩類大算力芯片:

P 芯片(Prefill):面向計算密集型需求設(shè)計,滿足 Prefill 階段的高算力要求;

D 芯片(Decode):面向訪存密集型需求設(shè)計,滿足 Decode 階段的高帶寬需求。

李愛軍介紹,公司在芯片微架構(gòu)層面針對 Attention 及 AFN 等計算特點進行細粒度分析,并在底層實現(xiàn)針對性優(yōu)化。在一個包含 1024 顆芯片的超節(jié)點內(nèi),P 芯片與 D 芯片可實現(xiàn)有效組合,以滿足大模型云推理的集群化部署需求。

未來三年,云天勵飛規(guī)劃了三代芯片產(chǎn)品:

今年(第一年):打造第一代超節(jié)點P 芯片,面向百萬級長上下文場景進行 Prefill 推理優(yōu)化,算力水平對標Hopper架構(gòu);

明年(第二年):研發(fā)第一代超節(jié)點D 芯片,聚焦 Decode 推理的低時延目標,算力水平對標Blackwell架構(gòu);

2028 年(第三年):推出第二代超節(jié)點D 芯片,面向毫秒級推理時延目標進一步優(yōu)化,帶動 Prefill 與 Decode 性能提升,算力層面有望看齊下一代Rubin芯片。

李愛軍表示,上述路線圖的核心支撐是云天勵飛的GPNPU 架構(gòu)。GPNPU 不僅是處理器架構(gòu),也體現(xiàn)了對大模型推理系統(tǒng)架構(gòu)的整體理解,其主要技術(shù)亮點包括四個方面:

GPGPU 級通用編程能力(CUDA 兼容):面向國內(nèi)芯片“易用性”痛點,GPNPU 架構(gòu)強調(diào)對主流 CUDA 等生態(tài)的兼容與遷移支持,以降低客戶模型部署與遷移門檻;

極致能效的 NPU 內(nèi)核:圍繞推理效率與能效比進行深度優(yōu)化,提升推理側(cè)性價比;

引入 3D Memory 結(jié)構(gòu):采用 3D Memory 結(jié)構(gòu),以獲得更高帶寬與更低訪問時延,提升推理效率;

算力積木架構(gòu):公司延續(xù)過去五年在國產(chǎn)工藝上的探索,以“算力積木”架構(gòu)定義下一代芯片的 Scale-up 超節(jié)點,以滿足萬億級乃至十萬億級 MoE 架構(gòu)大模型的推理需求。

推理時代的競爭,本質(zhì)是“單位推理成本”的競爭。只有把推理做得足夠便宜、足夠穩(wěn)定、足夠易用,AI 才能從“看得見的能力”走向“用得起的生產(chǎn)力”。

未來,云天勵飛將以 GPNPU 架構(gòu)為核心,大力推進云端大算力芯片,強化軟硬協(xié)同與存儲體系攻堅,力爭將百萬 Tokens 推理成本降低 100 倍以上,推動大模型從示范應用走向規(guī)?;桓丁?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39684

    瀏覽量

    301287
  • 云天勵飛
    +關(guān)注

    關(guān)注

    0

    文章

    182

    瀏覽量

    12649
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1524

    瀏覽量

    16737

原文標題:云天勵飛公布大算力芯片戰(zhàn)略:目標把百萬 Tokens 推理成本降低 100 倍以上

文章出處:【微信號:IntelliFusion2,微信公眾號:云天勵飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    百億Token一分錢!云天喊出“推理成本萬倍降”,公布三年三芯路線圖

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)當前,全球人工智能邁入具身智能(Agentic AI)時代,云天董事長兼CEO陳寧博士在“大
    的頭像 發(fā)表于 02-09 14:54 ?4268次閱讀
    百億Token一分錢!<b class='flag-5'>云天</b><b class='flag-5'>勵</b><b class='flag-5'>飛</b>喊出“推理成本萬倍降”,公布三年三芯路線圖

    力爭百萬 Tokens 推理成本降低百倍:云天發(fā)布未來三年大芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    2月3日,云天正式舉辦“大芯片
    的頭像 發(fā)表于 02-03 20:25 ?1920次閱讀
    力爭百萬 Tokens 推理成本降低百倍:<b class='flag-5'>云天</b><b class='flag-5'>勵</b><b class='flag-5'>飛</b>發(fā)布未來三年大<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b><b class='flag-5'>戰(zhàn)略</b>,首曝 DeepVerse 路線圖

    云天與360集團簽署戰(zhàn)略合作協(xié)議

    12月22日,云天與360集團簽署戰(zhàn)略合作協(xié)議。雙方將圍繞“納米AI”底座建設(shè)、大模型安
    的頭像 發(fā)表于 12-25 17:09 ?507次閱讀

    云天:AI推理需求狂飆,國產(chǎn)芯片機遇期加速到來

    今年來自國內(nèi)外的半導體創(chuàng)新領(lǐng)袖企業(yè)高管們又帶來哪些前瞻觀點?此次,電子發(fā)燒友網(wǎng)特別采訪了云天,以下是這家公司對2026年半導體產(chǎn)業(yè)的分析與展望。
    的頭像 發(fā)表于 12-23 10:13 ?1.1w次閱讀
    <b class='flag-5'>云天</b><b class='flag-5'>勵</b><b class='flag-5'>飛</b>:AI推理需求狂飆,國產(chǎn)<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>機遇期加速到來

    AI教父Hinton對話云天陳寧

    在大模型步入深水區(qū)的當下,AI 的下一個臨界點究竟在哪里?在 2025 GIS 全球創(chuàng)新峰會現(xiàn)場,深度學習奠基人、“AI 教父” Geoffrey Hinton 與云天董事長兼 CEO 陳寧
    的頭像 發(fā)表于 12-03 14:04 ?688次閱讀

    云天AI推理芯片如何賦能千行百業(yè)

    11月26日,云天會客廳第二期生態(tài)沙龍暨深商聯(lián)高科技高成長創(chuàng)新營走進上市公司活動圓滿舉辦。來自深圳科技領(lǐng)域的多位企業(yè)負責人齊聚云天,共同
    的頭像 發(fā)表于 12-03 13:58 ?619次閱讀

    云天亮相2025中國國際半導體博覽

    2025年11月23日,第二十二屆中國國際半導體博覽(IC China 2025)在北京國家會議中心啟幕。在24日舉辦的 “人工智能及大模型芯片論壇” 上,云天
    的頭像 發(fā)表于 11-25 11:29 ?686次閱讀

    云天與金蝶達成戰(zhàn)略合作

    11月4日,在2025金蝶全球創(chuàng)見者大會上,云天與金蝶簽署戰(zhàn)略合作協(xié)議。
    的頭像 發(fā)表于 11-05 18:09 ?1665次閱讀

    云天攜手合作伙伴共探AI產(chǎn)業(yè)新拐點

    10月17日,云天攜手深圳市人工智能產(chǎn)業(yè)協(xié)會舉辦“智見未來·Agent時代的產(chǎn)業(yè)機遇”主題沙龍,邀請來自全國50余家企業(yè)高管齊聚深圳,共同探討AI時代的新趨勢、新挑戰(zhàn)與新機遇。
    的頭像 發(fā)表于 10-27 10:12 ?920次閱讀

    云天飛出席第二屆灣區(qū)半導體產(chǎn)業(yè)投融資戰(zhàn)略發(fā)展論壇

    在2025灣芯展同期舉辦的第二屆灣區(qū)半導體產(chǎn)業(yè)投融資戰(zhàn)略發(fā)展論壇上,云天董事長兼CEO陳寧受邀出席并發(fā)表演講。
    的頭像 發(fā)表于 10-27 10:02 ?712次閱讀

    云天亮相2025灣區(qū)半導體產(chǎn)業(yè)生態(tài)博覽

    在2025灣區(qū)半導體產(chǎn)業(yè)生態(tài)博覽(灣芯展)上,云天以“積木”為核心理念,攜全棧AI推理
    的頭像 發(fā)表于 10-16 17:45 ?997次閱讀

    云天與前海大數(shù)據(jù)公司、勤達睿達成戰(zhàn)略合作

    近日,深圳市前海大數(shù)據(jù)資源管理中心有限公司、深圳云天技術(shù)股份有限公司、勤達睿香港有限公司(Kyndryl)正式簽署戰(zhàn)略合作協(xié)議,圍繞智
    的頭像 發(fā)表于 10-11 14:02 ?556次閱讀

    云天正式加入OISA生態(tài)

    近日,云天正式加入 OISA 生態(tài),攜手產(chǎn)業(yè)伙伴共同推動國產(chǎn) AI 芯片互聯(lián)體系建設(shè),為中國
    的頭像 發(fā)表于 10-11 13:59 ?640次閱讀

    云天亮相2025全球AI芯片峰會

    9 月 17 日,全球 AI 芯片峰會在上海舉行,云天董事長兼 CEO 陳寧出席并發(fā)表演講。
    的頭像 發(fā)表于 09-17 17:56 ?1363次閱讀

    云天亮相SEMI-e 2025深圳國際半導體展

    9月10日,SEMI-e深圳國際半導體展暨2025集成電路產(chǎn)業(yè)創(chuàng)新展在深圳舉行。云天受邀出席同期舉辦的“端側(cè)AI芯片新架構(gòu)與新應用專題研
    的頭像 發(fā)表于 09-12 14:31 ?1693次閱讀