免看一级a一片wW88,亚洲国产精品微拍大全

9月14-15日，2023全球AI芯片峰會(huì)（GACS 2023）在深圳正式舉行?？究萍紤?yīng)邀出席大會(huì)，副總裁王曉陽(yáng)發(fā)表主題為《驅(qū)動(dòng)云/邊緣側(cè)算力建設(shè)的高性能互聯(lián)接口方案》的演講。在演講中，王曉陽(yáng)分享了AIGC產(chǎn)業(yè)算力需求引發(fā)的芯片互聯(lián)趨勢(shì)，并對(duì)算力芯片瓶頸進(jìn)行了分析，提出了奎芯內(nèi)存互聯(lián)解決方案和Chiplet方案落地案例。

AIGC引爆的芯片互聯(lián)趨勢(shì)

最近幾年AI模型快速發(fā)展，模型規(guī)模每年差不多10倍速度增長(zhǎng)，當(dāng)令人驚訝的1750億參數(shù)的GPT3已成為過(guò)去式，迎來(lái)更大體量的萬(wàn)億參數(shù)時(shí)代，AI系統(tǒng)算力需求也隨之增加，幾乎每季度翻倍增長(zhǎng)。最近幾年體系結(jié)構(gòu)討論最多的問(wèn)題之一就是如何破解兩堵墻：內(nèi)存墻和I/O墻。多年來(lái)通過(guò)工藝進(jìn)步，計(jì)算架構(gòu)設(shè)計(jì)革新等方法，理論算力的增長(zhǎng)速度是驚人的，但是內(nèi)存帶寬，互聯(lián)帶寬的增長(zhǎng)卻相對(duì)緩慢，造成了巨大的落差，最近業(yè)界也在嘗試很多方法來(lái)縮小這些差距比如：增加緩存，多級(jí)緩存架構(gòu)，堆疊緩存；盡量提高單節(jié)點(diǎn)算力減少互聯(lián)的overhead；用高速的芯片互聯(lián)和系統(tǒng)互聯(lián)的SerDes做芯片互聯(lián)等等。

英偉達(dá)GH200非常重點(diǎn)的強(qiáng)調(diào)HBM帶寬，LPDDR容量，以及NVLINK的速度。AMD發(fā)布的MI300X對(duì)算力指標(biāo)提都不提，只提內(nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬。因此可以看到在LLM的游戲規(guī)則下，內(nèi)存容量、內(nèi)存帶寬以及互聯(lián)帶寬成了最核心的競(jìng)爭(zhēng)力，而算力的重要性相對(duì)下降。

算力芯片瓶頸分析

目前主流AI大芯片采用HBM為主，它的價(jià)格相對(duì)其他內(nèi)存要貴，但單位帶寬成本較低。

HBM使用有諸多限制，其一是因?yàn)镠BM的顆粒必須和SOC的Die要對(duì)齊，合封在一起，所以它是一個(gè)緊耦合的狀態(tài)，會(huì)帶來(lái)如下限制：在HBM數(shù)量方面，SoC與HBM必須保持貼合，導(dǎo)致HBM顆粒數(shù)量受限于芯片邊緣長(zhǎng)度；在熱管理方面，DRAM的溫度敏感性會(huì)限制SoC的工作頻率，從而影響性能，而SoC與HBM之間的熱交互對(duì)測(cè)試提出了更高的要求；在設(shè)計(jì)實(shí)施方面，HBM IP的布局和適配性相對(duì)不夠靈活；另外，工藝限制要求SoC與HBM HOST IP必須采用相同的工藝制程；最后，需要注意的是SoC的面積占用問(wèn)題，在12納米工藝下每個(gè)HBM HOST IP大約占據(jù)30mm2，限制了計(jì)算單元的面積。

其二是主流HBM的應(yīng)用還是以先進(jìn)封裝為主，包括Silicon interposer 或者Silicon Bridge等，也帶來(lái)了不少限制：Interposer尺寸受限制，最大只能有3到4個(gè)曝光面積；2.5D封裝的成本較高，與標(biāo)準(zhǔn)封裝相比價(jià)格高出4倍，近期臺(tái)積電的CoWoS單價(jià)上漲了20%；采用uBump作為連接點(diǎn)時(shí)，測(cè)試覆蓋率有限，當(dāng)封裝中包含超過(guò)6個(gè)HBM和2個(gè)ASIC時(shí)，良率明顯下降；最后，CoWoS產(chǎn)能有限，臺(tái)積電的CoWoS產(chǎn)能緊缺，國(guó)內(nèi)2.5D封裝技術(shù)還不夠成熟。

奎芯基于UCIe接口的HBM互聯(lián)方案

針對(duì)這些問(wèn)題，奎芯科技打造一站式解決方案—M2LINK，用于將HBM和SoC解耦?；咀龇ㄊ抢靡活wChiplet將HBM接口協(xié)議轉(zhuǎn)成UCIE接口協(xié)議，然后用RDL interposer 把Chiplet和HBM內(nèi)存封裝成一個(gè)標(biāo)準(zhǔn)模組，最后通過(guò)普通基板來(lái)和主SoC進(jìn)行封裝。這樣主SoC和標(biāo)準(zhǔn)模組間距離預(yù)計(jì)可以拉遠(yuǎn)到2.5cm，克服了原先主SoC和HBM緊耦合和綁定的限制，同時(shí)也無(wú)需受限于先進(jìn)封裝的高成本和Si Interposer的有限尺寸。除此之外還有諸多好處，比如以UCIe IP取代HBM IP，節(jié)省了主芯片面積，主芯片成本降低；單位邊長(zhǎng)可以連接更多的HBM標(biāo)準(zhǔn)模組，內(nèi)存容量和帶寬都可以得到提升等等。

以目前主流芯片為例，SoC近HBM的邊長(zhǎng)為30mm的話，可以擺放6個(gè)HBM顆粒，利用M2LINK方案的話，雙邊共可以擺放8個(gè)HBM模組，同等大小的SoC可利用面積增大44%，內(nèi)存容量帶寬增加1/3, 最大封裝面積可以增加一倍以上。

奎芯Chiplet落地解決方案

奎芯科技作為國(guó)內(nèi)領(lǐng)先的互聯(lián)IP產(chǎn)品及Chiplet產(chǎn)品供應(yīng)商，國(guó)產(chǎn)自研內(nèi)存及互聯(lián)解決方案，奎芯LPDDR5X接口速率可達(dá)8533Mbps，業(yè)界領(lǐng)先。奎芯D2D接口則具有高速率、低功耗、低延遲等優(yōu)勢(shì)。而奎芯HBM接口可支持國(guó)產(chǎn)工藝 PHY+ Controller 全套方案，速率可達(dá)6.4Gbps。目前，奎芯已經(jīng)有70件知識(shí)產(chǎn)權(quán)申請(qǐng)，以及16件榮譽(yù)獎(jiǎng)項(xiàng)。

奎芯科技基于對(duì)于整個(gè)封裝供應(yīng)鏈的整合能力，目前和客戶一起打造一款標(biāo)準(zhǔn)的帶HBM3的2.5D全國(guó)產(chǎn)封裝大芯片，將會(huì)提供包含HBM IP, interposer設(shè)計(jì)，2.5D封裝的設(shè)計(jì)的完整的turn key solution。

同時(shí)，奎芯科技基于D2D（UCIe）解耦SoC和HBM HOST的思路不僅適用于云端訓(xùn)練和推理的大算力芯片，在端側(cè)已經(jīng)有具體實(shí)踐的案例，目前在給客戶打造的是一款低功耗計(jì)算產(chǎn)品的IO die。對(duì)于此場(chǎng)景，客戶希望計(jì)算部分用最先進(jìn)的制程，考慮到昂貴的成本，客戶還是希望解耦內(nèi)存接口放到成熟工藝上實(shí)現(xiàn)，因此我們給客戶打造一顆包含 LPDDR host 的完整IO die, 實(shí)現(xiàn)內(nèi)存接口解耦，降低成本，為客戶未來(lái)產(chǎn)品升級(jí)增加靈活性。

奎芯科技致力于建立開(kāi)放生態(tài)的一站式Chiplet服務(wù)平臺(tái)，提供接口IP，Chiplet，系統(tǒng)設(shè)計(jì)和先進(jìn)封裝設(shè)計(jì)等服務(wù)，配套強(qiáng)大的供應(yīng)鏈資源及高效的系統(tǒng)整合服務(wù)，為客戶提供完整的一站式解決方案。

來(lái)源：奎芯科技

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴