以下文章來源于逍遙設(shè)計(jì)自動化,作者逍遙科技
CPO技術(shù)轉(zhuǎn)型的必然性
數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)正在經(jīng)歷向光電共封裝(CPO)交換機(jī)的根本性轉(zhuǎn)變,這種轉(zhuǎn)變主要由其顯著的功耗效率優(yōu)勢所驅(qū)動。在OFC 2025展會上,這一趨勢變得極為明顯,從Jensen Huang在GTC 2025上的演示到眾多供應(yīng)商展示集成在ASIC封裝內(nèi)的光引擎,CPO技術(shù)已經(jīng)成為塑造高帶寬網(wǎng)絡(luò)基礎(chǔ)設(shè)施未來的主導(dǎo)力量。
CPO技術(shù)的強(qiáng)有力論據(jù)在于其解決傳統(tǒng)可插拔光模塊所面臨的日益嚴(yán)重功耗挑戰(zhàn)的能力。盡管像Andy Bechtolsheim這樣的行業(yè)資深人士繼續(xù)倡導(dǎo)線性可插拔光模塊(LPO)作為替代方案,但擴(kuò)展到更高SerDes速度的技術(shù)現(xiàn)實(shí)使CPO的采用幾乎不可避免。LPO雖然通過消除板載數(shù)字信號處理器相比傳統(tǒng)可插拔光模塊節(jié)省30%到50%的功耗,但在數(shù)據(jù)速率攀升至每通道400千兆位世代時(shí),在ASIC與前面板光模塊之間的電氣界面上面臨著無法克服的插入損耗挑戰(zhàn)[1]。
1理解CPO集成方法
在ASIC封裝內(nèi)集成光引擎遵循兩種主要的架構(gòu)策略,每種策略都為不同的部署場景提供獨(dú)特的優(yōu)勢。這些方法代表了管理電氣、熱學(xué)和光學(xué)設(shè)計(jì)約束之間復(fù)雜相互作用的完全不同的理念。
硅Interposer方法將核心die和電子集成線路(EIC)共同放置在硅Interposer上,光電子集成芯片(PIC)要么3D堆疊在EIC之上,要么位于有機(jī)基板內(nèi)。這種配置創(chuàng)造了業(yè)內(nèi)專家稱為"光學(xué)I/O"的結(jié)構(gòu),通過高密度die到die連接和復(fù)雜的Interposer布線實(shí)現(xiàn)核心die與光引擎之間的電氣連接縮短。然而,當(dāng)高功耗EIC與核心die共享空間時(shí),這種方法引入了顯著的熱管理復(fù)雜性,特別是當(dāng)PIC堆疊在EIC頂部時(shí),散熱變得相當(dāng)困難。
圖1:將光引擎集成到半導(dǎo)體封裝中的不同方法,顯示了硅Interposer和有機(jī)基板方法及其各自的優(yōu)勢和熱考慮因素。
替代的有機(jī)基板方法將光引擎保持在圍繞主die的有機(jī)基板上,避免了與大型硅Interposer相關(guān)的復(fù)雜性和成本。在這種配置中,PIC和EIC組件組裝在一起,通常EIC堆疊在PIC之上,形成緊湊的光引擎模塊,戰(zhàn)略性地安裝在核心die周圍。這種排列允許優(yōu)越的熱隔離,因?yàn)楣庖婵梢苑珠_放置,并可能配備單獨(dú)的散熱器或定位以優(yōu)化氣流和冷板可達(dá)性。
2比較行業(yè)領(lǐng)導(dǎo)者:Broadcom和Nvidia的實(shí)現(xiàn)方案
當(dāng)前的CPO領(lǐng)域由來自行業(yè)領(lǐng)導(dǎo)者Broadcom和Nvidia的兩種截然不同的方法主導(dǎo),每種方法都反映了不同的優(yōu)先級和目標(biāo)應(yīng)用。這些實(shí)現(xiàn)為CPO技術(shù)部署中固有的實(shí)際挑戰(zhàn)和權(quán)衡提供了寶貴的見解。
Broadcom的Bailly CPO交換機(jī)基于Tomohawk-5 ASIC構(gòu)建,在封裝內(nèi)集成了八個(gè)6.4Tbps光引擎,提供51.2Tbps的總封裝外光帶寬。這個(gè)解決方案支持64個(gè)800Gbps端口或128個(gè)400Gbps端口,代表了在800G以太網(wǎng)時(shí)代與當(dāng)前網(wǎng)絡(luò)基礎(chǔ)設(shè)施需求相一致的實(shí)用方法。
圖2:Broadcom的實(shí)現(xiàn)方案,其特點(diǎn)是圍繞Tomohawk-5 ASIC集成的八個(gè)6.4Tbps光引擎,提供51.2Tbps總帶寬,專注于在當(dāng)前數(shù)據(jù)中心環(huán)境中的實(shí)際部署。
Nvidia采用更激進(jìn)的方法,其Quantum-X InfiniBand和Spectrum-X以太網(wǎng)平臺針對顯著更高的帶寬容量。Quantum-X系統(tǒng)通過四個(gè)CPO封裝提供115.2Tbps,每個(gè)提供28.8Tbps帶寬,而Spectrum-X系列從102.4Tbps擴(kuò)展到令人印象深刻的409.6Tbps配置。這些雄心勃勃的規(guī)格反映了Nvidia專注于使用200G SerDes技術(shù)支持未來百萬GPU集群需求。
圖3:Nvidia雄心勃勃的Quantum-X系統(tǒng)架構(gòu),展示了為大規(guī)模AI集群部署提供115.2Tbps帶寬而設(shè)計(jì)的四封裝配置。
在可維護(hù)性方法上出現(xiàn)了一個(gè)關(guān)鍵的架構(gòu)差異。Broadcom將光引擎永久綁定在封裝內(nèi),創(chuàng)造了一個(gè)更簡單但可維護(hù)性較低的解決方案。Nvidia通過創(chuàng)新的可拆卸光學(xué)子Assembly(OSA)解決了可維護(hù)性問題,其中三個(gè)1.6Tbps光子引擎聚集成可更換的4.8Tbps模塊。這種模塊化設(shè)計(jì)使得在制造測試期間可以更換有故障的光組件而無需丟棄整個(gè)交換機(jī),盡管現(xiàn)場可維護(hù)性仍然具有挑戰(zhàn)性。
圖4:Nvidia對CPO實(shí)現(xiàn)的復(fù)雜方法,其特點(diǎn)是可拆卸光學(xué)子Assembly(OSA)和使用TSMC的COUPE工藝的先進(jìn)2.5D/3D集成技術(shù),以增強(qiáng)可維護(hù)性。
圖5:Quantum-X和Spectrum-X CPO封裝。提供了對Nvidia chiplet組織的詳細(xì)見解,主核心交換die與通過die到die接口緊密集成的八個(gè)I/O die,被有機(jī)基板中的光子引擎所包圍。
3技術(shù)實(shí)現(xiàn)細(xì)節(jié)
CPO系統(tǒng)背后的技術(shù)復(fù)雜性在檢查其光纖耦合和激光集成策略時(shí)變得明顯。Broadcom和Nvidia都開發(fā)了巧妙的解決方案來管理其高帶寬系統(tǒng)所需的大規(guī)模光連接。
Broadcom采用邊緣耦合光纖連接,通過使用自動化、高精度Assembly工藝將精確對準(zhǔn)的光纖陣列永久綁定到波導(dǎo)端面來實(shí)現(xiàn)出色的海濱密度。其第一代CPO利用400G-FR4技術(shù),實(shí)施粗波長分復(fù)用(CWDM)在單根光纖上承載四個(gè)100G通道,每個(gè)6.4Tbps光引擎需要16對光纖。
Nvidia的方法在激光集成中展現(xiàn)了顯著的效率,僅需要18個(gè)激光模塊就能為其Quantum-X系統(tǒng)中的所有144個(gè)光通道提供光源。每個(gè)激光模塊包含八個(gè)集成激光器并支持八個(gè)1.6Tbps光子引擎,相比Broadcom的實(shí)現(xiàn)方案激光模塊需求減少了四倍。這種效率伴隨著容錯(cuò)性的權(quán)衡,因?yàn)閱蝹€(gè)激光故障會影響更多的光通道。
調(diào)制器技術(shù)選擇反映了功耗和可擴(kuò)展性方面的不同優(yōu)先級。Broadcom可能采用馬赫-曾德調(diào)制器(MZM),提供優(yōu)越的溫度穩(wěn)定性和激光不穩(wěn)定性容忍度,但功耗更高,為每比特5-10皮焦耳。Nvidia選擇微環(huán)諧振器調(diào)制器(MRM)實(shí)現(xiàn)了每比特1-2皮焦耳的顯著更低功耗,具有適合高密度應(yīng)用的更小占用面積,盡管需要更復(fù)雜的調(diào)諧和數(shù)字信號處理來管理熱敏感性和串?dāng)_。
4功耗效率和未來展望
CPO技術(shù)的功耗效率成就代表了其相對于傳統(tǒng)可插拔解決方案最引人注目的優(yōu)勢。Broadcom報(bào)告每800Gbps端口約5.5瓦,相比等效可插拔模塊的15瓦,轉(zhuǎn)化為6-7皮焦耳每比特的性能,在2024年部署中領(lǐng)先行業(yè)。Nvidia聲稱通過其硅基光電子實(shí)現(xiàn)方案實(shí)現(xiàn)了更激進(jìn)的3.5倍功耗效率改進(jìn)。
這些效率提升使?jié)M載的高帶寬交換機(jī)相比可插拔替代方案節(jié)省數(shù)百瓦特,盡管熱管理仍然具有挑戰(zhàn)性。兩種實(shí)現(xiàn)方案都需要復(fù)雜的冷卻解決方案,液體冷卻對于管理ASIC封裝內(nèi)的集中功率密度變得必要。
展望未來發(fā)展,幾項(xiàng)新興技術(shù)有望進(jìn)一步增強(qiáng)CPO能力。垂直耦合技術(shù)可以通過在芯片表面而不僅僅是周邊實(shí)現(xiàn)光輸入/輸出來克服邊緣長度約束。多芯光纖和減小光纖間距技術(shù)為顯著增加帶寬密度提供了途徑,研究演示實(shí)現(xiàn)了低至18微米的光纖間距。
圖6:光子Fabric或Interposer示意圖,展示了光子Interposer或Fabric的概念,如何將光交換和路由能力集成到計(jì)算chiplet下方的基礎(chǔ)層中,本質(zhì)上為未來高帶寬應(yīng)用創(chuàng)建光學(xué)主板。
圖7:光子Interposer示意圖,顯示了光子Interposer實(shí)現(xiàn)的另一種愿景,說明了光連接如何能夠?yàn)閮?nèi)存分解和封裝內(nèi)chiplet間超低延遲通信的新架構(gòu)提供支持。來源:Celestial.ai
CPO技術(shù)的未來延伸超越了傳統(tǒng)交換應(yīng)用,進(jìn)入了令人興奮的新領(lǐng)域。光子Fabric和Interposer代表了下一個(gè)演進(jìn)步驟,可能實(shí)現(xiàn)光學(xué)主板,其中激光器、波導(dǎo)和光交換位于支持上方計(jì)算和存儲chiplet的基礎(chǔ)層中。雖然這些3D配置中的熱管理挑戰(zhàn)仍然存在,但成功的CPO交換機(jī)部署將建立技術(shù)基礎(chǔ)、供應(yīng)鏈基礎(chǔ)設(shè)施和這些先進(jìn)實(shí)現(xiàn)所需的行業(yè)信心。
向CPO技術(shù)的轉(zhuǎn)變不僅僅是簡單的組件升級,而是通過在顯著降低功耗的同時(shí)實(shí)現(xiàn)空前的帶寬密度從根本上重塑數(shù)據(jù)中心架構(gòu)。隨著行業(yè)繼續(xù)推向更高數(shù)據(jù)速率和更苛刻的AI工作負(fù)載,CPO作為連接當(dāng)前能力與未來需求的基礎(chǔ)技術(shù),使其不僅是一個(gè)有吸引力的選擇,而且是下一代網(wǎng)絡(luò)基礎(chǔ)設(shè)施的必然需求。
關(guān)于我們:
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
-
封裝技術(shù)
+關(guān)注
關(guān)注
12文章
592瀏覽量
69008 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5417瀏覽量
74312 -
光模塊
+關(guān)注
關(guān)注
81文章
1543瀏覽量
61350
原文標(biāo)題:光電共封裝技術(shù)解析
文章出處:【微信號:深圳市賽姆烯金科技有限公司,微信公眾號:深圳市賽姆烯金科技有限公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Broadcom光電共封裝技術(shù)解析

CPO光電共封裝如何破解數(shù)據(jù)中心“功耗-帶寬”困局?
應(yīng)用于CPO封裝模塊內(nèi)的光纖互聯(lián)方案
用于高速光電組件的光焊球陣列封裝技術(shù)
電子封裝技術(shù)最新進(jìn)展
Avago推出新封裝光電耦合器
微光電子機(jī)械系統(tǒng)器件技術(shù)與封裝
光電共封裝
光電共封裝

光芯片和電芯片共封裝技術(shù)的創(chuàng)新應(yīng)用

什么是 CoWoS 封裝技術(shù)?
IBM光學(xué)技術(shù)新進(jìn)展:光電共封裝提升AI模型效率
光電共封裝技術(shù)CPO的演變與優(yōu)勢

評論