作者:Arm 基礎(chǔ)設(shè)施事業(yè)部營銷副總裁 Eddie Ramirez
在我們近期與業(yè)界伙伴的多次交流中,明顯發(fā)現(xiàn)芯粒時(shí)代的大幕已徐徐拉開,行業(yè)已經(jīng)不再抱存對(duì)芯粒的質(zhì)疑態(tài)度,而是正在合作解決如何借助芯粒技術(shù),在集成電路的生態(tài)系統(tǒng)中設(shè)計(jì)、驗(yàn)證和部署多供應(yīng)商系統(tǒng)的實(shí)際問題。這樣的轉(zhuǎn)變讓行業(yè)聚焦芯粒實(shí)現(xiàn)的探討,而將芯粒由定制化工程項(xiàng)目轉(zhuǎn)向可擴(kuò)展行業(yè)實(shí)踐則必須從以下三大關(guān)鍵領(lǐng)域談起。
可擴(kuò)展芯粒應(yīng)用的三大支柱
要充分釋放芯粒潛力,我們必須恪守三大核心準(zhǔn)則:
為軟件開發(fā)者提供便利的開發(fā)體驗(yàn)
如果沒有可擴(kuò)展的軟件支持,再精妙的硬件也將黯然失色。軟件必須能跨越多代 IP 保持穩(wěn)定兼容。開發(fā)者必須能夠在不增加復(fù)雜度的情況下,輕松實(shí)現(xiàn)基于芯粒設(shè)計(jì)的編程、配置和部署。這就要求行業(yè)確立通用通信協(xié)議、模塊化固件以及一致化的軟件接口。
為整個(gè)供應(yīng)鏈構(gòu)建可復(fù)用的芯片
現(xiàn)如今,多數(shù)芯粒設(shè)計(jì)仍限于單一供應(yīng)商內(nèi)部完成。但真正的規(guī)?;枰獙⑿玖^D(zhuǎn)化為產(chǎn)品,包括跨不同設(shè)計(jì)點(diǎn),甚至跨代際的可復(fù)用性、互操作性和可組合性。這需要晶圓代工廠、IP 供應(yīng)商、封裝合作伙伴和 OEM 廠商之間更深層次的整合。
全面推進(jìn)系統(tǒng)級(jí)標(biāo)準(zhǔn)
雖然 UCIe 等接口標(biāo)準(zhǔn)已取得重大突破,但這僅解決了部分問題。真正的互操作性取決于系統(tǒng)級(jí)規(guī)范,包括芯粒通信機(jī)制、啟動(dòng)流程、內(nèi)存共享及遙測數(shù)據(jù)接口。而這正是 Arm 芯粒系統(tǒng)架構(gòu) (Chiplet System Architecture, CSA) 的愿景所在,CSA 目前已得到 70 多家合作伙伴的大力支持。
從超大規(guī)模云服務(wù)到邊緣側(cè)
AI 正在推動(dòng)轉(zhuǎn)變
為何選擇芯粒,又為何是現(xiàn)在?答案唯有一個(gè):人工智能 (AI)。
AI 工作負(fù)載正在重塑計(jì)算堆棧的方方面面。從數(shù)據(jù)中心到汽車系統(tǒng)再到邊緣設(shè)備,加速器不僅占用了更多的空間,也消耗了更多的電力。隨著 AI 的擴(kuò)展,業(yè)界亟需更靈活、更高效的方式來集成 CPU、NPU、GPU、內(nèi)存和 I/O。
這正是芯粒技術(shù)的優(yōu)勢(shì)所在:芯粒支持模塊化設(shè)計(jì),可以獨(dú)立地?cái)U(kuò)展計(jì)算單元或內(nèi)存,高效地實(shí)現(xiàn) SKU 多樣化配置,并且更加精準(zhǔn)地優(yōu)化功耗/散熱預(yù)算。對(duì)于小型企業(yè)來說,芯粒技術(shù)更能讓他們無需投入單片系統(tǒng)級(jí)芯片 (SoC) 研發(fā)成本即可進(jìn)軍應(yīng)用需求更為復(fù)雜的市場。
與此同時(shí),借助 Arm KleidiAI,Arm 確保開發(fā)者可以橫跨云端到諸如樹莓派的邊緣側(cè)設(shè)備等各類硬件實(shí)現(xiàn),在一致的 AI 軟件棧上運(yùn)行推理。
生態(tài)系統(tǒng)工程:
Arm 全面設(shè)計(jì)和 Project Leapfrog
為了支持芯粒的大規(guī)模應(yīng)用,業(yè)界不僅要繼續(xù)完善規(guī)范,還需要產(chǎn)業(yè)鏈協(xié)同推進(jìn)。這一共同訴求催生了 Arm 全面設(shè)計(jì) (Arm Total Design) 生態(tài)項(xiàng)目,Arm 聯(lián)合晶圓代工廠、設(shè)計(jì)公司、IP 供應(yīng)商、EDA 提供商及 OEM 廠商的力量,加速開發(fā)經(jīng)過芯片驗(yàn)證、具備互操作性的芯粒解決方案。
此次合作最具突破性的成果當(dāng)屬 Project Leapfrog。Project Leapfrog 是一項(xiàng)由多家行業(yè)供應(yīng)商聯(lián)合推進(jìn)的雄心計(jì)劃,旨在打造基于芯粒的 AI 訓(xùn)練平臺(tái),該平臺(tái)不僅可媲美 NVIDIA GB200 等單片架構(gòu),更在能效、擴(kuò)展性和開放性方面具有顯著優(yōu)勢(shì)。
它的底層技術(shù)包括:
計(jì)算子系統(tǒng):ADTechnology 通過使用 Arm Neoverse 計(jì)算子系統(tǒng) (CSS) 構(gòu)建面向 AI 密集型工作負(fù)載的 64 核芯粒。
AI 加速器:由 Rebellions 提供專為深度學(xué)習(xí)訓(xùn)練與推理優(yōu)化的高性能加速器芯粒。
結(jié)構(gòu)芯粒:封裝內(nèi)計(jì)算和 AI 引擎的高效互連邏輯。
內(nèi)存和 I/O:借助先進(jìn) UCIe 連接將基于 HBM 的內(nèi)存子系統(tǒng)和先進(jìn) I/O 進(jìn)行集成。
封裝和工藝:利用三星代工廠領(lǐng)先的 3nm/4nm 工藝和 2.5D I-Cube 封裝技術(shù)。
Project Leapfrog 的突破性不僅體現(xiàn)在硬件上,更在于其協(xié)作模式。這率先證明了,通過模塊化多供應(yīng)商芯粒組合,同樣能實(shí)現(xiàn)媲美垂直集成 SoC 的出色性能。早期測試表明,Project Leapfrog 成果的能效可優(yōu)于傳統(tǒng) GPU 架構(gòu) AI 訓(xùn)練系統(tǒng)的三倍。
這勾勒出了半導(dǎo)體產(chǎn)業(yè)的未來:專用芯片設(shè)計(jì)、協(xié)同技術(shù)創(chuàng)新,以及可大規(guī)模實(shí)現(xiàn)的性能優(yōu)化。
標(biāo)準(zhǔn)、軟件和未來之路
在硬件不斷進(jìn)步的同時(shí),行業(yè)最大的瓶頸或許在于軟件和系統(tǒng)集成層面?;谛玖5脑O(shè)計(jì)需要采用如下新方法來實(shí)現(xiàn):
跨分解式組件的安全啟動(dòng)和遙測
跨芯粒邊界的調(diào)試
固件模塊化和平臺(tái)支持
芯片前階段的系統(tǒng)級(jí)驗(yàn)證
這就是Arm 開發(fā) CSA 規(guī)范的核心動(dòng)力。該規(guī)范匯集 70 余家合作伙伴共同制定,涵蓋了安全和遙測接口、固件啟動(dòng)序列和一致加速器集成等各種問題,并已于今年初正式發(fā)布。針對(duì)不同用例(如計(jì)算到加速器、基于 I/O 的設(shè)計(jì)),我們創(chuàng)建了相應(yīng)的配置文件,每個(gè)方案均包含明確定義的接口和協(xié)議。
自該規(guī)范發(fā)布以來,市場反饋令人振奮。業(yè)界對(duì)擴(kuò)展 CSA 應(yīng)用表現(xiàn)出濃厚興趣,特別是在安全實(shí)現(xiàn)方案、機(jī)密計(jì)算,以及汽車與航空航天領(lǐng)域的低延遲實(shí)時(shí)系統(tǒng)等方面。
此外,Arm 還與新思科技、Cadence 和西門子等 EDA 行業(yè)前沿企業(yè)合作,共同開發(fā)芯片前的建模、協(xié)同驗(yàn)證和仿真環(huán)境等解決方案,讓基于芯粒的系統(tǒng)與單片系統(tǒng)一樣穩(wěn)健可靠。
更令人振奮的是:OEM 廠商已開始就芯粒方案(而不僅僅是 SoC)采購意向書 (RFI)。這表明,相關(guān)市場思維正在生根發(fā)芽。
齊頭并進(jìn)的行業(yè)目標(biāo)
預(yù)計(jì)五年內(nèi),云計(jì)算、汽車、移動(dòng)設(shè)備和工業(yè)領(lǐng)域的主流企業(yè)都將采用相關(guān)的定制芯片方案。而芯粒是讓這一切成為可能的關(guān)鍵技術(shù)。這不僅僅是一種封裝解決方案,更是企業(yè)獲取能效優(yōu)勢(shì)、差異化性能和加速上市的戰(zhàn)略推動(dòng)力。這一轉(zhuǎn)型離不開全行業(yè)協(xié)同推進(jìn)。
芯粒經(jīng)濟(jì)依賴于一個(gè)集體愿景:可靈活組合的系統(tǒng)、可互操作的產(chǎn)品和跨企業(yè)的通用語言。Arm 致力于通過開放標(biāo)準(zhǔn)、可擴(kuò)展 IP 和 Project Leapfrog 等實(shí)際合作項(xiàng)目,推動(dòng)這一愿景落地。
我們正朝著共同的目標(biāo),一步一個(gè)腳印,齊頭并進(jìn),扎扎實(shí)實(shí)地構(gòu)建計(jì)算未來。
-
集成電路
+關(guān)注
關(guān)注
5450文章
12531瀏覽量
373578 -
ARM
+關(guān)注
關(guān)注
135文章
9532瀏覽量
390303 -
芯粒
+關(guān)注
關(guān)注
0文章
84瀏覽量
408
原文標(biāo)題:迎接芯粒時(shí)代,重塑計(jì)算未來
文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Arm加速構(gòu)建汽車開放芯粒生態(tài)
UCIe協(xié)議代際躍遷驅(qū)動(dòng)開放芯粒生態(tài)構(gòu)建
面向芯粒設(shè)計(jì)的最佳實(shí)踐
奇異摩爾助力OISA全向智感互聯(lián)IO芯粒技術(shù)白皮書發(fā)布
芯粒技術(shù)的專利保護(hù)挑戰(zhàn)與應(yīng)對(duì)策略
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+半導(dǎo)體芯片產(chǎn)業(yè)的前沿技術(shù)
技術(shù)資訊 I 基于芯粒(小晶片)的架構(gòu)掀起汽車設(shè)計(jì)革命
微電子所在芯粒集成電遷移EDA工具研究方向取得重要進(jìn)展
奇異摩爾出席第三屆芯粒開發(fā)者大會(huì)AI芯片與系統(tǒng)分論壇
一種集成FPGA和DSP芯粒的異構(gòu)系統(tǒng)級(jí)封裝
借助Arm芯粒技術(shù)構(gòu)建計(jì)算未來
評(píng)論