在 AI、HPC 與云計算基礎設施飛速演進的當下,性能瓶頸不再源于算力,而是網絡系統(tǒng)中的每一個微秒延遲與每一瓦能耗。
為應對這一挑戰(zhàn),星融元推出了旗艦級產品:CX864E-N 64x800G 超低時延 RoCE 交換機。
該產品具備業(yè)界領先的560ns端口轉發(fā)時延和基于 SONiC 的開放網絡架構,為下一代 AI 智算網絡提供極致性能保障和靈活的方案集成空間。
近期國內外展會上,CX864E-N已吸引了大量客戶與行業(yè)專家的關注。對此,我們決定不再“藏著掖著”,而是大方展示我們的技術實力與設計理念 —— 星融元將一直以坦誠、開放的態(tài)度與客戶和同行共同推動開放網絡的行業(yè)進步。

CX864E-N 早在去年已實現(xiàn)量產并成功部署于多家頭部互聯(lián)網企業(yè)與云服務提供商的數據中心,并且交付周期已縮短至約2周,在性能、交期與成本的多維度比較中名列前茅。
CX864E-N 硬件外觀概覽
設備前面板
在2U高的前面板上,排布著64個800G OSPF 端口,其前后向兼容性可確保從現(xiàn)有的 100GE/200GE/400GE 網絡無縫過渡到更高級的800GE,保護歷史投資。

在管理口方面,CX864E-N 提供RJ45 MGMT、USB2.0接口及RJ45 Console。
另外,CX864E-N 還提供兩個額外的 10G SFP+ 端口,專門用于增強帶內網絡遙測 (INT) 等管理功能。這一考慮至關重要,因為 800G 交換機上的每個端口都承擔著相當大的工作負載,如出現(xiàn)問題,影響會顯著放大,因此需要更精準、實時的通信監(jiān)控。(當然,客戶也還可以根據其他網絡需求靈活運用這兩個端口)

面板右側還有6個LED指示燈,其中靠近RJ45口的兩個分別為:
- LINK/ACT燈,指示 MGMT接口的link及數據通訊狀態(tài)
- SYS燈,指示整機系統(tǒng)的運行狀態(tài);
面板右側豎排四個指示燈從上到下依次為:
- BMC狀態(tài)指示燈(BMC)
- 電源指示燈(P)
- 風扇狀態(tài)指示燈(F)
- 設備定位指示燈(L)
前面板分布著橫、縱向排列的三排小型進風孔。外部冷空氣正是通過這些氣孔進入機箱內部,與風冷系統(tǒng)協(xié)同工作,有效提升整體散熱效率。
設備背部
CX864E-N 設備背部配備了4個風扇模塊以及2個電源模塊,為系統(tǒng)提供穩(wěn)定、高效的散熱與供電保障。所有風扇與電源均支持熱插拔,無需中斷系統(tǒng)運行。電源模塊集中布局于設備左側,單個功率為 3200W。


您可能會問:市面上的800G交換機大多有6到8個風扇,而CX864E-N僅有4個,散熱如何保證?關于這個問題我們會在下一個部分來解答。
CX864E-N 內部硬件
讓我們揭開這臺高性能交換機的蓋版,從左至右,依次探索這款設備的核心構造,深入了解其內部硬件設計。

散熱板
首先看到的是大面積覆蓋的散熱板(已拆出放置),這是我們采用了 3D真空腔均熱板技術的高效風冷散熱模塊。

相比部分廠商選擇的水冷方案,該散熱設計在整機滿配功耗高達 2180W 的極限工況下,依然能夠穩(wěn)定滿足系統(tǒng)運行需求,同時將整機功耗控制在業(yè)內較低水平,能效表現(xiàn)出色。在該負載條件下,風扇僅需以約 60% 轉速運行便可維持散熱系統(tǒng)的正常運作,有效控制噪音水平,避免對運行環(huán)境造成干擾。
ASIC 模塊

散熱板下即是 Marvell Teralynx 10 ASIC 模塊(以下簡稱“TL10”), 安裝在 OSFP 接口背后,是整機網絡交換處理能力的核心。TL10是一顆基于 5nm 工藝、單芯片架構的可編程交換芯片,提供51.2 Tbps的吞吐能力。
TL10 的超低時延性能是其最大亮點之一,可將端到端時延控制在約 560 納秒,在同類芯片中表現(xiàn)極為出色。對于 AI 模型訓練、推理以及大規(guī)模并行計算任務,低延遲意味著更快的同步、更高的吞吐、更低的能耗浪費,從而提升整個集群效率。
大容量片上緩存(200+ MB):顯著提升 RoCE 傳輸性能,能夠有效緩解網絡擁塞引發(fā)的數據排隊與等待問題。相比競品采用的外置 HBM 方案,片上緩存在功耗、訪問延遲以及成本控制方面具備顯著優(yōu)勢。
- 先進的帶內遙測(INT)功能
- Flowlet 調度機制:通過引入 Flowlet 級別的負載均衡策略,TL10 在高吞吐場景下依然可保持穩(wěn)定的數據分發(fā)效率。該機制顯著降低了對緩存資源的依賴,僅需約 200MB,即可滿足復雜網絡環(huán)境下的調度與擁塞控制需求。
- 高 Radix 架構(512×100GbE):支持網絡大規(guī)模橫向擴展,助力數據中心從傳統(tǒng)三層架構向扁平化兩層架構演進,顯著減少網絡設備數量與布線復雜度,提高整體網絡效率與可靠性。
- 領先的能效比:在面向大規(guī)模 AI 訓練集群的實際部署中,TL10 相較于同類方案可節(jié)省超過 1MW 功耗,在每瓦帶寬和計算密度方面處于業(yè)界領先水平,顯著降低長期運營成本(TCO)。

文末我們將展示基于 TL10 芯片設備的實際延遲測試結果。
電源模組
在ASIC上方是斜向排列的一組電源模組。它們?yōu)楹诵牡?ASIC 芯片提供穩(wěn)定電力支持。值得一提的是,這種非平行布局經過優(yōu)化,可有效提升電源完整性,為高速數據傳輸保駕護航。

PTP模塊
電源模組上方為 PTP(精確時間協(xié)議)模塊,支持高達10ns 的PTP與SyncE精度。該模塊為可選功能,采用可插拔設計,客戶可按需定制,靈活部署。下圖是PTP模塊已安裝與未安裝狀態(tài)的實物圖對比。


COMe 模塊
長方體組件正是我們的 COMe 模塊,基于 x86 架構,搭載 Intel Xeon 處理器,具備強大的計算性能,能夠支持 INT-based Routing 等高級網絡功能。上面運行我們自研的基于 SONiC -based AsterNOS 操作系統(tǒng),為交換機提供穩(wěn)定、高效的控制平面核心,確保整機在復雜網絡環(huán)境下的靈活調度與可靠運行。

BMC 模塊
COMe模塊右側是BMC模塊,它同樣采用可插拔設計,客戶可根據需求升級BMC模塊,解鎖更高性能與更豐富的管理功能。

NVMe 插槽
COMe 模塊左側是兩個全長 2280 的 NVMe 插槽,以及一個兼容 2280 和 2242 尺寸的 M.2 SATA 插槽,為用戶提供靈活的本地存儲擴展能力。
此外,兩個 2280 NVMe 插槽還可選配最多兩顆 Hailo-10 AI 加速引擎,支持實時、低延遲且高能效的邊緣 AI 推理計算,滿足多種智能和AI應用場景的部署需求。

風扇
整機后部配備 4 個可熱插拔風扇模塊,構成高效簡潔的風冷系統(tǒng)。這里也回答了之前的問題,在滿負載運行(2180W)下,這套散熱方案已完全能夠穩(wěn)定運行,無需塞入額外的風扇來控制溫度,大大降低了功耗與系統(tǒng)復雜度。更少的組件,意味著更高的可靠性與更低的運營成本。

其他補充
CX864E-N 整機內部僅使用了一根線纜,其他連接均通過高性能連接器實現(xiàn)板間互聯(lián),避免了因復雜線纜引起的信號干擾和維護難題。相比一些友商使用多根線纜的做法,這種設計更可靠,也更利于長期穩(wěn)定運行。

CX864E-N的PCB采用全球領先的制造工藝,并選用業(yè)內已大規(guī)模量產的頂級高性能板材,結合Vippo、盲孔(Blind Hole)、背鉆(Back Drill)等先進技術工藝,全面滿足112G高速SerDes在信號完整性(Signal Integrity)、損耗(Loss)、串擾(Crosstalk)等方面的嚴苛技術要求。
CX864E-N 軟件概述
星融元 CX864E-N交換機搭載企業(yè)級 SONiC 發(fā)行版 —— AsterNOS。我們致力于打造業(yè)界領先的企業(yè)版 SONiC,助力客戶構建高性能、智能化的網絡系統(tǒng),從控制面到數據面構建起軟硬一體的協(xié)同架構。

加速 AI 網絡,釋放超算潛能
作為超以太網聯(lián)盟(UEC)的早期成員,Asterfusion 借助超級以太網技術,將網絡利用率提升至 90% 甚至更高,全面加速 AI 網絡部署與數據中心演進。
解鎖AI數據中心潛力:網絡利用率如何突破90%?
星融元 CX864E-N RoCE交換機通過 Flowlet 負載均衡、基于 INT 的智能路由與 WCMP 等先進技術,實現(xiàn) AI 訓練與推理網絡超過 90% 的利用率。這不僅顯著提升 AI 工作負載效率,同時有效降低數據中心建設與運營成本
- 全功能交鑰匙解決方案:AsterNOS 基于社區(qū) SONiC 構建,強化了 EVPN 多歸屬、RoCEv2、Ansible 自動化 等企業(yè)特性,專為復雜部署環(huán)境而設計。與自研的開放網絡硬件深度適配,提供真正即插即用的一體化解決方案。
- 更快的版本發(fā)布節(jié)奏與響應機制:相比社區(qū)半年一版的發(fā)布頻率AsterNOS 實現(xiàn)了季度新版本發(fā)布,確??蛻粜枨笈c問題能被快速響應與解決。
- 專業(yè)支持團隊,靈活定制服務:超過 120 名SONiC軟件研發(fā)工程師,為客戶提供專業(yè)、靈活的服務支持,包括定制功能開發(fā)、問題定位優(yōu)化以及全方位的技術咨詢。
- 雙模式CLI風格,提升用戶體驗:除了 Linux 風格的 Bash CLI,AsterNOS 還基于 Klish 實現(xiàn)了 Cisco 風格的命令行界面,幫助網絡工程師更輕松上手,降低學習曲線。
- 560ns 超低轉發(fā)時延、64×800G OSFP 高密度接口、TL10單芯片架構、超大片上緩存、板間無纜互聯(lián)、定制級 PTP和AI 模塊、每一行走線,每一個模塊、都是星融元面向 AI 工作負載與低延遲網絡的工程化答案。
附錄:相關測試數據



-
交換機
+關注
關注
23文章
2842瀏覽量
103301 -
AI
+關注
關注
88文章
37012瀏覽量
290033 -
硬件系統(tǒng)
+關注
關注
0文章
50瀏覽量
11784
發(fā)布評論請先 登錄
800G OSFP DR8 光模塊:100G PAM4 技術驅動的超高速數據中心互聯(lián)核心
睿海光電800G光模塊助力全球AI基建升級
睿海光電領航AI光模塊:超快交付與全場景兼容賦能智算時代——以創(chuàng)新實力助力全球客戶構建高效算力底座
睿海光電以高效交付與廣泛兼容助力AI數據中心800G光模塊升級
加速AI未來,睿海光電800G OSFP光模塊重構數據中心互聯(lián)標準


評論