Arm的Advanced Microcontroller Bus Architecture(AMBA)在與生態(tài)系統(tǒng)合作解決復(fù)雜的行業(yè)性問題方面有著悠久的歷史?,F(xiàn)在,隨著行業(yè)接納芯粒(chiplets)技術(shù),是時(shí)候?qū)MBA從片上擴(kuò)展到多芯片了。
在這篇博客中,我們將概述AMBA Coherent Hub Interface(CHI)芯片互聯(lián)(chip to chip, C2C)的方法——這是對片上CHI的擴(kuò)展,旨在使CHI適用于芯片間互聯(lián)。
我們還將說明AMBA CHI C2C如何努力與UCIe等芯片片間標(biāo)準(zhǔn)化相輔相成,以進(jìn)一步推動協(xié)作。
為什么選擇芯粒,為什么是現(xiàn)在?
正如我們在以前的博客文章中討論過的那樣,行業(yè)正處于一個拐點(diǎn),芯粒正在在各個領(lǐng)域和應(yīng)用中得到采用。
對芯粒的投資是由當(dāng)前在SoC設(shè)計(jì)中所面臨的巨大經(jīng)濟(jì)壓力推動的。SoC的復(fù)雜性和性能要求不斷增長,而每個新的先進(jìn)制造工藝節(jié)點(diǎn)(5納米及以下)的成本也在增加。然而,這些新節(jié)點(diǎn)帶來的好處并沒有相應(yīng)增加。例如,雖然邏輯的面積持續(xù)縮小,但I(xiàn)/O和存儲器的收益卻遞減。高昂的成本也阻礙了新SoC或衍生產(chǎn)品的數(shù)量。
這種情況為芯粒提供了絕佳的機(jī)會。芯粒使得在當(dāng)前被芯片尺寸限制的性能上進(jìn)行擴(kuò)展成為可能,同時(shí)管理芯片成本并提供更大的可組合性。
標(biāo)準(zhǔn)化至關(guān)重要
AMBA一直是片上通信的開放標(biāo)準(zhǔn)。AMBA為各種設(shè)計(jì)提供了一個共同的標(biāo)準(zhǔn),確保了SoC中不同組件之間的兼容性。它為設(shè)計(jì)集成提供了靈活性、可擴(kuò)展性、設(shè)計(jì)復(fù)用性。
AMBA規(guī)范(如CHI和AXI)是免費(fèi)提供的,并與行業(yè)各方合作共同開發(fā)。AMBA被廣泛應(yīng)用于Arm生態(tài)系統(tǒng)及其他領(lǐng)域。它具有長期可靠性和信任度,在過去27年中已經(jīng)在數(shù)十億臺設(shè)備中使用,涵蓋了各個市場和應(yīng)用領(lǐng)域。
AMBA所帶來的標(biāo)準(zhǔn)化是支撐SoC設(shè)計(jì)和無廠(fabless)半導(dǎo)體模式的基礎(chǔ)。這種標(biāo)準(zhǔn)化構(gòu)建了一個繁榮的生態(tài)系統(tǒng)和一個兼容IP和工具的綜合市場。其中包括處理器、加速器、互連、控制器、外設(shè),以及來自芯片合作伙伴、IP供應(yīng)商和其他合作伙伴的驗(yàn)證IP(VIP)、建模工具和性能工具。
標(biāo)準(zhǔn)化對于芯粒同樣至關(guān)重要。隨著行業(yè)從當(dāng)前的定制芯片互聯(lián)轉(zhuǎn)向多供應(yīng)商可組合芯片互聯(lián),標(biāo)準(zhǔn)化將變得更加重要。
具有標(biāo)準(zhǔn)化明確定義和可互操作的層也至關(guān)重要。
明確定義和可互操作的層可以實(shí)現(xiàn)設(shè)計(jì)復(fù)用,降低成本和上市時(shí)間。不同的實(shí)現(xiàn)可以優(yōu)先考慮和關(guān)注不同的用例和需求,提供更大的靈活性并促進(jìn)創(chuàng)新。
芯粒需要物理、傳輸和協(xié)議層的標(biāo)準(zhǔn)化。更不用說軟件模型、機(jī)械、熱管理和功耗的標(biāo)準(zhǔn)了。還需要進(jìn)行芯片驗(yàn)證、可靠性測試、合規(guī)性測試和許多其他方面的工作。
為什么選擇AMBA CHI?
AMBA CHI架構(gòu)提供了處理器、加速器和存儲器等大型網(wǎng)絡(luò)所需的性能和擴(kuò)展性。
更重要的是,CHI是高速、可靠且分組化的,這使其也非常適用于芯粒。同時(shí),CHI是廣泛使用的開放標(biāo)準(zhǔn),為芯粒提供了低風(fēng)險(xiǎn)和簡單的利用方式。
CHI協(xié)議提供了一個完整的緩存一致性模型,與架構(gòu)無關(guān),支持用于使用snoop filter和directory-based 的系統(tǒng)。它公布于2013年,并不斷發(fā)展,增加了新功能和性能提升。其廣泛的功能列表包括:
- 原子和互斥事務(wù) (Atomic and exclusive transactions)
- 用于降低延遲的優(yōu)化流程,如DMT、DCT和DWT
- 基于奇偶校驗(yàn)的接口保護(hù)
- 低功耗,具有不同級別的控制
- 寫入零、數(shù)據(jù)省略和本地復(fù)制 (Write zero, data elision and copy-at-home),以減少數(shù)據(jù)傳輸
- Distributed Virtual Memory(DVM)管理
- 用于機(jī)密計(jì)算的領(lǐng)域管理擴(kuò)展(Realm Management Extensio,RME)
CHI作為基礎(chǔ)設(shè)施應(yīng)用程序在超大規(guī)模計(jì)算、服務(wù)器和網(wǎng)絡(luò)領(lǐng)域取得了極大的成功。CHI現(xiàn)在已經(jīng)廣泛應(yīng)用并在其他多個市場領(lǐng)域中得到驗(yàn)證,例如移動和汽車領(lǐng)域,這些領(lǐng)域也需要完全硬件一致性和高性能。
引入AMBA CHI C2C
我們很高興介紹AMBA CHI C2C,這是CHI的擴(kuò)展,用于芯片片間互聯(lián)(chiplet-to-chiplet)。
通過C2C,即芯片片間互聯(lián)(chiplet-to-chiplet),我們指的是芯粒(multi-die或die-to-die)和芯片間連接(multi-chip通過PCB連接)。
CHI C2C針對先進(jìn)的異構(gòu)系統(tǒng),和基于Arm的一致性SMP。它提供了一個統(tǒng)一的設(shè)備連接接口,包括計(jì)算、加速器和存儲器。不僅用于全一致性傳輸,也用于I/O和非一致性傳輸。
CHI C2C專注于協(xié)議(protocol )和信息打包(packetization )層。CHI C2C利用現(xiàn)有的片上CHI協(xié)議,并定義了如何對其進(jìn)行信息打包,使其適合通過芯片片間互連進(jìn)行傳輸。包格式針對鏈路利用率和延遲進(jìn)行了優(yōu)化,同時(shí)避免了復(fù)雜的打包和解包方案。
相同的架構(gòu)特性可以跨越芯片間的邊界,芯片之間可以共享相同的存儲器和安全模型。這可以避免協(xié)議轉(zhuǎn)換、不兼容性和額外的延遲。
這種分層的方法可以與底層傳輸進(jìn)行清晰的分離,因此CHI可以在UCIe或其他方式上使用,無論它是否標(biāo)準(zhǔn)化。
使用CHI和UCIe streaming
UCIe已經(jīng)匯集了行業(yè)領(lǐng)導(dǎo)者,提供了標(biāo)準(zhǔn)化的芯片片間接口,并取得了很大的動力。它提供了適用于芯片片間集成的物理層(PHY)和適配器(adapter),以及軟件模型和合規(guī)性測試。
UCIe還提供了優(yōu)秀的協(xié)議靈活性。它采用了多協(xié)議棧方法,允許在單個物理鏈路上使用多個協(xié)議。PCIe和CXL可用于傳統(tǒng)的片外設(shè)備,而Streaming接口可用于插入其他協(xié)議,使其非常適合傳輸AMBA CHI。
下面我們以使用UCIe Streaming的基于CHI的多芯片系統(tǒng)為例進(jìn)行說明。它具有重要的優(yōu)勢:
- 無縫使用架構(gòu)特定功能--通過與片上系統(tǒng)一樣的CHI協(xié)議的傳輸,可以無縫使用架構(gòu)特定功能,無需協(xié)議轉(zhuǎn)換。
- 鏈路穩(wěn)定性--UCIe Streaming 接口提供了鏈路穩(wěn)定性,例如使用UCIe定義的數(shù)據(jù)鏈路CRC和重傳機(jī)制。
總結(jié)
CHI C2C規(guī)范正在開發(fā)中,和其他所有AMBA規(guī)范一樣,將按照現(xiàn)有的AMBA許可和治理模型進(jìn)行發(fā)布。也就是說,它將免費(fèi)提供,免版稅,與架構(gòu)無關(guān),并具有廣泛和永久的實(shí)現(xiàn)權(quán)利[1],換句話說,非常適合廣泛采用。
通過利用現(xiàn)有的AMBA許可和治理模型,CHI C2C將能夠與CHI協(xié)議本身保持同步發(fā)展,并與現(xiàn)有AMBA生態(tài)系統(tǒng)的要求保持一致。當(dāng)然,我們確保它仍然針對UCIe和其他傳輸進(jìn)行優(yōu)化。
該模型遵循分層的標(biāo)準(zhǔn)化方法和其他協(xié)議的現(xiàn)有治理模型,例如CXL和PCIe,也可以與UCIe一起使用。
基于此,我們預(yù)計(jì)CHI C2C將在各個領(lǐng)域和應(yīng)用中得到應(yīng)用。從高性能基礎(chǔ)設(shè)施應(yīng)用到汽車領(lǐng)域等,隨著時(shí)間的推移,還包括現(xiàn)有的大量基于AXI的設(shè)計(jì),這對于在C2C中進(jìn)行啟用至關(guān)重要。
評論