突破傳統(tǒng)基礎(chǔ)設(shè)施
從云到邊緣,Arm Neoverse 正憑借出色的性能、效率、設(shè)計(jì)靈活性和總體擁有成本 (TCO) 優(yōu)勢(shì),革新傳統(tǒng)基礎(chǔ)設(shè)施芯片領(lǐng)域。
云和超大規(guī)模服務(wù)運(yùn)營(yíng)商正不斷增大計(jì)算密度。隨著 Microsoft Cobalt、阿里巴巴的倚天 710、AmpereOne等配置 128 核或以上的 CPU 設(shè)計(jì)進(jìn)入市場(chǎng),單個(gè)封裝可實(shí)現(xiàn)的性能更強(qiáng),且下一代的目標(biāo)還將遠(yuǎn)高于 128 核。
隨著 CPU 性能逐步提高,市場(chǎng)對(duì)人工智能 (AI)、網(wǎng)絡(luò)和加密加速器等專用計(jì)算的需求也隨之持續(xù)增長(zhǎng)。這顯然需要將這些加速器集成在一起,才能更有效地提高性能和效率,與此同時(shí),還需實(shí)現(xiàn)模塊化設(shè)計(jì),以便將加速器與不同的通用計(jì)算引擎進(jìn)行混合搭配。
基于 Neoverse N3 CPU 的Neoverse CSS N3
圖 1:Neoverse CSS N3 概覽
Arm Neoverse 計(jì)算子系統(tǒng) (CSS) 支持在新的工藝節(jié)點(diǎn)上快速開(kāi)發(fā)先進(jìn)的系統(tǒng)級(jí)芯片 (SoC)。通過(guò)在設(shè)計(jì)中使用預(yù)配置、預(yù)驗(yàn)證的 CSS,合作伙伴節(jié)省了 80 人/年的工程師時(shí)間,以及相應(yīng)的機(jī)會(huì)成本,使其能夠?qū)W⒂趯?shí)現(xiàn)助其系統(tǒng)增值的“秘密法寶”。
Neoverse CSS N3 構(gòu)建在 Neoverse CSS N2 經(jīng)過(guò)市場(chǎng)驗(yàn)證的優(yōu)良表現(xiàn)之上,能通過(guò)新的架構(gòu)功能提供更高的性能和效率,為數(shù)據(jù)中心市場(chǎng)帶來(lái)更優(yōu)越的單芯片性能和單 TCO 性能表現(xiàn)。此外,Neoverse CSS N3 還為邊緣和網(wǎng)絡(luò)應(yīng)用帶來(lái)了出色的效率。CSS N3 以 Neoverse S3 系統(tǒng) IP 為基礎(chǔ),Neoverse S3 系統(tǒng) IP 包括了一致性網(wǎng)狀網(wǎng)絡(luò) CMN S3、系統(tǒng)內(nèi)存管理單元 MMU S3 和片上網(wǎng)絡(luò) NOC S3。此外,CSS N3 還包含系統(tǒng)管理和本地控制處理器,以及 CPU 和系統(tǒng) IP 協(xié)同設(shè)計(jì)與共同開(kāi)發(fā),以優(yōu)化 PPA 和系統(tǒng)級(jí)功能的支持。
Neoverse CSS N3 支持 32 顆 Neoverse N3 核心,可在低至 40W 的功率范圍內(nèi)實(shí)現(xiàn)優(yōu)異性能。該產(chǎn)品具備高度可配置性,適用于電信、數(shù)據(jù)處理單元 (DPU) 、網(wǎng)絡(luò)和云等多個(gè)領(lǐng)域,可以在 8 核至 32 核之間進(jìn)行擴(kuò)展配置。
除了性能和效率的大幅提升之外,Neoverse CSS N3 還支持基于芯粒的設(shè)計(jì)。它支持 UCIe 晶粒間 (die-to-die) 連接標(biāo)準(zhǔn),結(jié)合 Arm 新的 AMBA CHI C2C 協(xié)議,為構(gòu)建異構(gòu)加速計(jì)算奠定了基礎(chǔ)??梢灶A(yù)見(jiàn)的是,Arm Neoverse CSS N3 將在當(dāng)今專用計(jì)算領(lǐng)域蓬勃發(fā)展。
基于 CSS N3 的芯??赏ㄟ^(guò) AMBA CHI C2C 連接到 I/O 一致性加速器,從而將加速器封裝在一起,進(jìn)一步提高性能和效率,這一方法可用來(lái)取代傳統(tǒng)的解決方案。在過(guò)往的解決方案中,其加速器是通過(guò) PCIe 進(jìn)行板級(jí)連接,這會(huì)導(dǎo)致更高的延遲、軟件復(fù)雜性和功耗。
Neoverse N3 CPU優(yōu)異的效率表現(xiàn)
以每瓦性能來(lái)衡量的性能效率是 CPU 評(píng)估的一大關(guān)鍵指標(biāo)。5G/6G 無(wú)線基礎(chǔ)設(shè)施要求現(xiàn)代計(jì)算解決方案表現(xiàn)出更高的性能,同時(shí)功耗預(yù)算須保持不變。新一代的 DPU 需要配備功能更強(qiáng)大的 CPU,以便在 PCIe 設(shè)備規(guī)范的限制內(nèi)運(yùn)行成熟的操作系統(tǒng)、虛擬機(jī)、容器及其他數(shù)據(jù)包處理功能。頭部云服務(wù)提供商正著手在機(jī)架的冷卻能力范圍內(nèi),部署核心數(shù)量更多、更密集的 CPU?!澳苄А睅缀跏撬屑?xì)分市場(chǎng)的主要設(shè)計(jì)決策要素。Neoverse N3 便是以能效作為其設(shè)計(jì)核心。
Neoverse N3 CPU 延續(xù)了 Neoverse N2 經(jīng)過(guò)市場(chǎng)驗(yàn)證的效率表現(xiàn)。經(jīng)過(guò) Arm CPU 設(shè)計(jì)團(tuán)隊(duì)的不懈努力,他們強(qiáng)化了分支預(yù)測(cè)器、預(yù)取器的性能,并優(yōu)化了微架構(gòu),進(jìn)而實(shí)現(xiàn)了效率的提升。此外,他們還改進(jìn)了電源管理表現(xiàn),增加了精度更高的每核動(dòng)態(tài)電壓頻率調(diào)整 (DVFS) 功能,以實(shí)現(xiàn)更出色的性能效率。這些工作成果使得 N3 在效率表現(xiàn)上比上一代產(chǎn)品提高了 20% 以上。
Neoverse N3 可以滿足多樣的 SoC 設(shè)計(jì)要求,包括 16 核網(wǎng)絡(luò)設(shè)計(jì)、32 核電信 RAN 或云 DPU 設(shè)計(jì),以及 192 核超大規(guī)模和云 CPU 等等。Neoverse N3 還提供了多種電壓和頻率選擇,與 Neoverse N2 相比,其每核性能效率提高了 20% 至近 50%。
圖 1:Arm Neoverse N3 CPU
延續(xù)卓越效率表現(xiàn)
在面積和功耗配置與 Neoverse N2 大致相同,且采用一樣的工藝節(jié)點(diǎn)下,Neoverse N3 在機(jī)器學(xué)習(xí) (ML) 和數(shù)據(jù)分析工作負(fù)載方面的性能約提升了三倍,在 SQL 數(shù)據(jù)庫(kù)、選定壓縮應(yīng)用程序,以及整數(shù)運(yùn)算性能等方面分別約提升了 1.3 倍、1.2 倍,以及 1.1 倍的性能。
靈活的緩存配置
Neoverse N3 提供多種緩存配置,可滿足不同計(jì)算場(chǎng)景的需求。許多橫向擴(kuò)展的云數(shù)據(jù)分析和數(shù)據(jù)庫(kù)應(yīng)用均能從更靠近核心的較大緩存中受益,因此我們?yōu)檫@一細(xì)分領(lǐng)域推出了 2MB L2 緩存選項(xiàng)。此外,1MB L2 緩存選項(xiàng)主要針對(duì) 5G/6G 無(wú)線基礎(chǔ)設(shè)施、企業(yè)網(wǎng)絡(luò)、DPU 和智能網(wǎng)卡 (SmartNIC) 以及超大規(guī)模服務(wù)器等各種任務(wù)中的通用計(jì)算,能夠?qū)崿F(xiàn)性能和面積的良好平衡;而較小的 32KB L1 和 128KB 則適合那些對(duì)緩存不敏感,但仍希望能以較小占用空間提供良好算力的工作負(fù)載。
總結(jié)
Neoverse N3 CPU 的推出實(shí)現(xiàn)了 Neoverse N 系列持續(xù)提供出色的每瓦性能的目標(biāo)。新的 CSS N3 結(jié)合了 Neoverse N3 優(yōu)異的性能和效率與 Neoverse S3 系統(tǒng) IP,成為一套定制性更強(qiáng)的計(jì)算子系統(tǒng)。與上一代的 CSS 相比,Neoverse CSS N3的每瓦性能可提高 20% 至近 50%。CSS N3 平臺(tái)適用于云到邊緣設(shè)計(jì),可幫助我們的合作伙伴將 Arm 強(qiáng)大的處理器與加密、網(wǎng)絡(luò)或 AI 加速器等等多種專用組件結(jié)合在一起,打造更具差異性的新產(chǎn)品。
我們的合作伙伴將有望在 2024 年底推出基于 Neoverse N3 和 CSS N3 的創(chuàng)新芯片設(shè)計(jì),讓我們共同翹首以待。
審核編輯:劉清
-
ARM
+關(guān)注
關(guān)注
134文章
9353瀏覽量
377691 -
加速器
+關(guān)注
關(guān)注
2文章
827瀏覽量
39131 -
SoC芯片
+關(guān)注
關(guān)注
1文章
646瀏覽量
35827 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249655
原文標(biāo)題:Arm Neoverse CSS N3 助力快速實(shí)現(xiàn)出色能效
文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Arm Neoverse N2平臺(tái)實(shí)現(xiàn)DeepSeek-R1滿血版部署

Arm 公司面向移動(dòng)端市場(chǎng)的 ?Arm Lumex? 深度解讀
解讀基于Arm Neoverse V2平臺(tái)的Google Axion處理器
Arm Neoverse CMN S3 推動(dòng)Compute Express Link (CXL) 存儲(chǔ)創(chuàng)新

如何在基于Arm Neoverse平臺(tái)的CPU上構(gòu)建分布式Kubernetes集群

基于MediaTek MT9679芯片的堅(jiān)果投影N3 Pro介紹
Arm技術(shù)助力Google Axion處理器加速AI工作負(fù)載推理

Arm Neoverse如何加速實(shí)現(xiàn)AI數(shù)據(jù)中心
烏鎮(zhèn)亮點(diǎn) Arm終端計(jì)算子系統(tǒng) (CSS) 榮膺世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng)

基于Arm Neoverse的微軟全新Azure虛擬機(jī)上線
級(jí)聯(lián)精密運(yùn)算放大器級(jí)以實(shí)現(xiàn)出色的交流和直流性能

如何調(diào)優(yōu)DS160PR410實(shí)現(xiàn)出色的信號(hào)完整性

基于Arm架構(gòu)的Azure虛擬機(jī)助力云原生應(yīng)用開(kāi)發(fā)
降壓轉(zhuǎn)換器實(shí)現(xiàn)出色PCB布局的五個(gè)步驟

評(píng)論