chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

驅(qū)動云/邊緣側(cè)算力建設的高性能互聯(lián)接口方案

jf_pJlTbmA9 ? 來源:奎芯科技 ? 作者:奎芯科技 ? 2023-11-23 16:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

9月14-15日,2023全球AI芯片峰會(GACS 2023)在深圳正式舉行。奎芯科技應邀出席大會,副總裁王曉陽發(fā)表主題為《驅(qū)動云/邊緣側(cè)算力建設的高性能互聯(lián)接口方案》的演講。在演講中,王曉陽分享了AIGC產(chǎn)業(yè)算力需求引發(fā)的芯片互聯(lián)趨勢,并對算力芯片瓶頸進行了分析,提出了奎芯內(nèi)存互聯(lián)解決方案和Chiplet方案落地案例。

AIGC引爆的芯片互聯(lián)趨勢

最近幾年AI模型快速發(fā)展,模型規(guī)模每年差不多10倍速度增長,當令人驚訝的1750億參數(shù)的GPT3已成為過去式,迎來更大體量的萬億參數(shù)時代,AI系統(tǒng)算力需求也隨之增加,幾乎每季度翻倍增長。最近幾年體系結(jié)構(gòu)討論最多的問題之一就是如何破解兩堵墻:內(nèi)存墻和I/O墻。多年來通過工藝進步,計算架構(gòu)設計革新等方法,理論算力的增長速度是驚人的,但是內(nèi)存帶寬,互聯(lián)帶寬的增長卻相對緩慢,造成了巨大的落差,最近業(yè)界也在嘗試很多方法來縮小這些差距比如:增加緩存,多級緩存架構(gòu),堆疊緩存;盡量提高單節(jié)點算力減少互聯(lián)的overhead;用高速的芯片互聯(lián)和系統(tǒng)互聯(lián)的SerDes做芯片互聯(lián)等等。

wKgZomVda3WAdBIBAADwKs34-fA147.jpg

英偉達GH200非常重點的強調(diào)HBM帶寬,LPDDR容量,以及NVLINK的速度。AMD發(fā)布的MI300X對算力指標提都不提,只提內(nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬。因此可以看到在LLM的游戲規(guī)則下,內(nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬成了最核心的競爭力,而算力的重要性相對下降。

算力芯片瓶頸分析

目前主流AI大芯片采用HBM為主,它的價格相對其他內(nèi)存要貴,但單位帶寬成本較低。

HBM使用有諸多限制,其一是因為HBM的顆粒必須和SOC的Die要對齊,合封在一起,所以它是一個緊耦合的狀態(tài),會帶來如下限制:在HBM數(shù)量方面,SoC與HBM必須保持貼合,導致HBM顆粒數(shù)量受限于芯片邊緣長度;在熱管理方面,DRAM的溫度敏感性會限制SoC的工作頻率,從而影響性能,而SoC與HBM之間的熱交互對測試提出了更高的要求;在設計實施方面,HBM IP的布局和適配性相對不夠靈活;另外,工藝限制要求SoC與HBM HOST IP必須采用相同的工藝制程;最后,需要注意的是SoC的面積占用問題,在12納米工藝下每個HBM HOST IP大約占據(jù)30mm2,限制了計算單元的面積。

其二是主流HBM的應用還是以先進封裝為主,包括Silicon interposer 或者Silicon Bridge等,也帶來了不少限制:Interposer尺寸受限制,最大只能有3到4個曝光面積;2.5D封裝的成本較高,與標準封裝相比價格高出4倍,近期臺積電的CoWoS單價上漲了20%;采用uBump作為連接點時,測試覆蓋率有限,當封裝中包含超過6個HBM和2個ASIC時,良率明顯下降;最后,CoWoS產(chǎn)能有限,臺積電的CoWoS產(chǎn)能緊缺,國內(nèi)2.5D封裝技術還不夠成熟。

奎芯基于UCIe接口的HBM互聯(lián)方案

針對這些問題,奎芯科技打造一站式解決方案—M2LINK,用于將HBM和SoC解耦。基本做法是利用一顆Chiplet將HBM接口協(xié)議轉(zhuǎn)成UCIE接口協(xié)議,然后用RDL interposer 把Chiplet和HBM內(nèi)存封裝成一個標準模組,最后通過普通基板來和主SoC進行封裝。這樣主SoC和標準模組間距離預計可以拉遠到2.5cm,克服了原先主SoC和HBM緊耦合和綁定的限制,同時也無需受限于先進封裝的高成本和Si Interposer的有限尺寸。除此之外還有諸多好處,比如以UCIe IP取代HBM IP,節(jié)省了主芯片面積,主芯片成本降低;單位邊長可以連接更多的HBM標準模組,內(nèi)存容量和帶寬都可以得到提升等等。

wKgZomVda3yAHPvGAAELq7n1XT0168.jpg

以目前主流芯片為例,SoC近HBM的邊長為30mm的話,可以擺放6個HBM顆粒,利用M2LINK方案的話,雙邊共可以擺放8個HBM模組,同等大小的SoC可利用面積增大44%,內(nèi)存容量帶寬增加1/3, 最大封裝面積可以增加一倍以上。

奎芯Chiplet落地解決方案

奎芯科技作為國內(nèi)領先的互聯(lián)IP產(chǎn)品及Chiplet產(chǎn)品供應商,國產(chǎn)自研內(nèi)存及互聯(lián)解決方案,奎芯LPDDR5X接口速率可達8533Mbps,業(yè)界領先??綝2D接口則具有高速率、低功耗、低延遲等優(yōu)勢。而奎芯HBM接口可支持國產(chǎn)工藝 PHY+ Controller 全套方案,速率可達6.4Gbps。目前,奎芯已經(jīng)有70件知識產(chǎn)權(quán)申請,以及16件榮譽獎項。

wKgaomVda4KAaU6LAAEMlVw-uU0487.jpg

奎芯科技基于對于整個封裝供應鏈的整合能力,目前和客戶一起打造一款標準的帶HBM3的2.5D全國產(chǎn)封裝大芯片,將會提供包含HBM IP, interposer設計,2.5D封裝的設計的完整的turn key solution。

wKgZomVda4mALNNIAAEB_o5y5LI780.jpg

同時,奎芯科技基于D2D(UCIe)解耦SoC和HBM HOST的思路不僅適用于云端訓練和推理的大算力芯片,在端側(cè)已經(jīng)有具體實踐的案例,目前在給客戶打造的是一款低功耗計算產(chǎn)品的IO die。對于此場景,客戶希望計算部分用最先進的制程,考慮到昂貴的成本,客戶還是希望解耦內(nèi)存接口放到成熟工藝上實現(xiàn),因此我們給客戶打造一顆包含 LPDDR host 的完整IO die, 實現(xiàn)內(nèi)存接口解耦,降低成本,為客戶未來產(chǎn)品升級增加靈活性。

奎芯科技致力于建立開放生態(tài)的一站式Chiplet服務平臺,提供接口IP,Chiplet,系統(tǒng)設計和先進封裝設計等服務,配套強大的供應鏈資源及高效的系統(tǒng)整合服務,為客戶提供完整的一站式解決方案。

來源: 奎芯科技

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    462

    文章

    53174

    瀏覽量

    453624
  • AI芯片
    +關注

    關注

    17

    文章

    2031

    瀏覽量

    36367
  • 算力
    +關注

    關注

    2

    文章

    1323

    瀏覽量

    16397
  • chiplet
    +關注

    關注

    6

    文章

    473

    瀏覽量

    13330
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    兆芯與安勤科技共建豐富邊緣計算方案

    日前,安勤科技“端融合、共創(chuàng)生態(tài)”邊緣與端側(cè)多元應用研討會在廣州、北京兩地成功舉辦。會議聚焦智慧城市、智能制造、智慧醫(yī)療三大領域,探討
    的頭像 發(fā)表于 09-28 18:00 ?651次閱讀

    IP廣域網(wǎng)助力互聯(lián)網(wǎng)建設進入快車道

    人工智能大模型等應用爆發(fā)式發(fā)展帶動了智能需求激增,全國各地紛紛建設大量智中心。在迎來新機遇的同時,力行業(yè)也面臨數(shù)據(jù)安全、提高企業(yè)用
    的頭像 發(fā)表于 09-25 10:40 ?336次閱讀

    中科曙光超智融合方案助力國產(chǎn)中心建設

    近期,位于魯中南地區(qū)的某大型中心正式啟動建設,標志著國產(chǎn)技術在該區(qū)域數(shù)字經(jīng)濟中的重要突破。該中心采用中科曙光“超智融合”
    的頭像 發(fā)表于 07-31 17:13 ?1130次閱讀

    EASY-EAI攜手Hailo,推出高性能、高邊緣AI硬件組合

    導讀EASY-EAI與Hailo建立合作關系,共同推出高邊緣AI產(chǎn)品組合。此次合作,EASY-EAI將采用Hailo公司的AI加速芯片,并與我司硬件相結(jié)合,打造一款性能優(yōu)異、性價
    的頭像 發(fā)表于 07-25 15:22 ?602次閱讀
    EASY-EAI攜手Hailo,推出<b class='flag-5'>高性能</b>、高<b class='flag-5'>算</b><b class='flag-5'>力</b>的<b class='flag-5'>邊緣</b>AI硬件組合

    華為助力互聯(lián)網(wǎng)跨域間無損互聯(lián)

    近日,NIDA發(fā)布的《工信部首提數(shù)據(jù)通信產(chǎn)業(yè),賦能互聯(lián)網(wǎng)新征程》一文引發(fā)廣泛關注。文章解讀工信部最新發(fā)布的《
    的頭像 發(fā)表于 06-14 11:17 ?765次閱讀

    華為AI WAN智IP廣域網(wǎng)助力互聯(lián)網(wǎng)建設

    的發(fā)展機遇。數(shù)據(jù)通信網(wǎng)絡的高效性、可靠性和智能化程度,直接決定了資源能否在廣域網(wǎng)范圍內(nèi)實現(xiàn)快速、精準的調(diào)配與利用,進而影響互聯(lián)網(wǎng)的整
    的頭像 發(fā)表于 06-11 11:21 ?818次閱讀

    6TOPSNPU加持!RK3588如何重塑8K顯示的邊緣計算新邊界

    在萬物互聯(lián)的時代背景下,邊緣計算與8K顯示的融合需求日益迫切。傳統(tǒng)的云端處理模式在面對8K超高清視頻數(shù)據(jù)時,常常出現(xiàn)延遲高、帶寬壓力大等問題,而邊緣計算設備由于
    發(fā)表于 04-18 15:32

    157 TOPS !AIO-OrinNX 主板助力邊緣 AI 應用

    Firefly最新推出NVIDlAJetsonOrin主板,搭載JetsonOrin系列核心模組,最高可達157TOPS,支持大模型私有化部署,為邊緣AI應用的開發(fā)與部署提供強勁的
    的頭像 發(fā)表于 04-02 16:33 ?2416次閱讀
    157 TOPS <b class='flag-5'>算</b><b class='flag-5'>力</b>!AIO-OrinNX 主板助力<b class='flag-5'>邊緣</b> AI 應用

    信而泰CCL仿真:解鎖AI極限,智中心網(wǎng)絡性能躍升之道

    中心RoCE網(wǎng)絡提供精準評估方案,助力企業(yè)突破瓶頸,釋放AI澎湃動力! 什么是智中心 智中心(AIDC,Artificial Int
    的頭像 發(fā)表于 02-24 17:34 ?790次閱讀
    信而泰CCL仿真:解鎖AI<b class='flag-5'>算</b><b class='flag-5'>力</b>極限,智<b class='flag-5'>算</b>中心網(wǎng)絡<b class='flag-5'>性能</b>躍升之道

    【一文看懂】什么是端側(cè)?

    隨著物聯(lián)網(wǎng)(IoT)、人工智能和5G技術的快速發(fā)展,端側(cè)正逐漸成為智能設備性能提升和智能化應用實現(xiàn)的關鍵技術。什么是端側(cè)
    的頭像 發(fā)表于 02-24 12:02 ?2346次閱讀
    【一文看懂】什么是端<b class='flag-5'>側(cè)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>?

    科技報到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?

    科技報到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?
    的頭像 發(fā)表于 01-16 10:24 ?661次閱讀

    未來邊緣GPU在車聯(lián)網(wǎng)中的創(chuàng)新應用(下)

    數(shù)據(jù),實現(xiàn)高效的通信和數(shù)據(jù)處理。邊緣GPU力作為一種高性能的計算設備,能夠在本地處理和分析來自車輛傳感器和外部環(huán)境的數(shù)據(jù),為車聯(lián)網(wǎng)應用提供強大的計算支持。邊緣GP
    的頭像 發(fā)表于 12-19 11:16 ?744次閱讀
    未來<b class='flag-5'>邊緣</b>GPU<b class='flag-5'>算</b><b class='flag-5'>力</b>在車聯(lián)網(wǎng)中的創(chuàng)新應用(下)

    華為助力貴州氣象高性能項目建設

    一體化網(wǎng)絡國家(貴州)樞紐節(jié)點建設氣象高性能,確保能夠有效支撐國家級數(shù)值模式的貴州本地化
    的頭像 發(fā)表于 11-25 10:19 ?759次閱讀

    GPU租用平臺是什么

    GPU租用平臺是一種基于計算的服務模式,它允許用戶通過互聯(lián)網(wǎng)按需租用高性能GPU資源,而無需自行購買、部署和維護這些硬件。
    的頭像 發(fā)表于 10-16 10:15 ?912次閱讀