電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)在今年的亞馬遜re:Invent 2024大會(huì)上,該公司正式對(duì)外發(fā)布了旗下第四代自研Arm芯片——Graviton4。作為目前最強(qiáng)大的Graviton處理器,Graviton4相較于上一代產(chǎn)品帶來(lái)了巨大的性能提升。同時(shí),為Graviton4賦能的Arm Neoverse也跟著受到了更多的關(guān)注。
強(qiáng)悍的Graviton4處理器
據(jù)介紹,Graviton4處理器每個(gè)核心都能提供比上代強(qiáng)30%的性能,vGPU數(shù)量和內(nèi)存容量也是上一代的3倍,能將處理大型Java應(yīng)用的速度提升45%,可以為企業(yè)提供更低成本和高效的高性能計(jì)算解決方案。
除了內(nèi)核性能的提升,亞馬遜還著重提升了Graviton4處理器的存儲(chǔ)性能,首次創(chuàng)建了雙插槽NUMA內(nèi)存集群。Graviton4處理器配備了高達(dá)1.5 TB的DDR5主內(nèi)存,運(yùn)行頻率為5.6 GHz,提供12個(gè)內(nèi)存通道。與之相比,上一代Graviton 3處理器使用了4.8 GHz主頻的DDR5內(nèi)存,只有8個(gè)內(nèi)存通道。并且,單個(gè)Graviton4處理器的內(nèi)存插槽就可以提供537.6 GB/秒的帶寬,能夠輕松應(yīng)對(duì)HPC負(fù)載。
此前,亞馬遜針對(duì)Graviton4處理器發(fā)布過(guò)一些測(cè)試實(shí)例,通過(guò)這些實(shí)例體現(xiàn)了這顆處理器強(qiáng)大的性能。比如,基于Graviton4處理器構(gòu)建UE5 Dedicated Server,據(jù)亞馬遜的說(shuō)法,最新的Graviton 4實(shí)例是迄今為止亞馬遜為各種workload設(shè)計(jì)的最強(qiáng)大并且最高效節(jié)能的CPU。Graviton 4的實(shí)例R8g相較于Graviton 3的實(shí)例R7g有大約30%的性能提升。實(shí)例R8g壓測(cè)使用Lyra Starter Game項(xiàng)目,通過(guò)增加AI Bot和GameClient的方式來(lái)增加Dedicated Server(簡(jiǎn)稱(chēng)DS)的負(fù)載,通過(guò)對(duì)比不同機(jī)型以及不同參數(shù)編譯出的DS在server full的情況下的CPU使用率和幀率(FPS)來(lái)對(duì)比性能。
結(jié)果顯示,Graviton 4的實(shí)例在UE Dedicated Server應(yīng)用場(chǎng)景下:
·相較于Graviton 3有約 25+%的性?xún)r(jià)比提升(均使用優(yōu)化參數(shù)編譯);
·相較于Intel Sapphire Rapids和AMD Genoa有30%~35%的性?xún)r(jià)比提升;
·使用Graviton針對(duì)C/C++的優(yōu)化參數(shù)來(lái)編譯Dedicated Server對(duì)性能提升約10%~25%。
根據(jù)外媒的測(cè)試,在相同的vCPU數(shù)量下,新的Graviton4處理器內(nèi)核大致與Intel Sapphire Rapids性能相當(dāng),同時(shí)能夠與AMD EPYC“Genoa”相媲美,并始終表現(xiàn)出極佳的代際提升。這都離不開(kāi)Arm Neoverse的賦能。
Graviton4 處理器背后的Arm Neoverse
Graviton4 處理器基于Arm?Neoverse?V2平臺(tái),這顆核心發(fā)布于2022年9月。Neoverse V2和Neoverse E2都是Arm公司內(nèi)部代號(hào)“Demeter”項(xiàng)目下的產(chǎn)品,Arm?Neoverse?V2平臺(tái)涵蓋Armv9架構(gòu)的新特性,包括高性能浮點(diǎn)和向量指令支持,以及SVE/SVE2、Bfloat16和INT8?MatMul等特性。這些特性為AI/機(jī)器學(xué)習(xí)?(ML)?以及高性能計(jì)算?(HPC)?工作負(fù)載提供了卓越性能。
根據(jù)Arm官方的介紹信息,得益于全面增強(qiáng)的核心性能、內(nèi)存帶寬和高達(dá)兩倍的L2緩存大?。亢?MB),Neoverse V2可以在云和ML應(yīng)用程序上提供兩倍于Neoverse V1的性能。根據(jù)Arm工程團(tuán)隊(duì)實(shí)際運(yùn)行EDA工作負(fù)載所得出的結(jié)果,Graviton4?提供的RTL仿真工作負(fù)載性能比Graviton3高出?37%。同時(shí),Neoverse V2具有出色的平臺(tái)擴(kuò)展性,當(dāng)與新的CMN-700核心網(wǎng)狀網(wǎng)絡(luò)配對(duì)時(shí),Neoverse V2 CPU可以配置多達(dá)256個(gè)內(nèi)核和512MB的系統(tǒng)級(jí)緩存(SLC)。AMBA CHI C2C使用UCIe、CXL、PCIe或自定義PHY來(lái)連接計(jì)算、內(nèi)存和加速器,實(shí)現(xiàn)高效、高速的芯片連接。
看過(guò)Graviton4處理器的性能之后,人們對(duì)下一代Arm服務(wù)器會(huì)更加期待,這些產(chǎn)品將搭載最新的Neoverse V3。2024年2月,Arm宣布推出新一代 Arm Neoverse技術(shù),Neoverse CSS V3則是V系列芯片IP的首款Neoverse CSS產(chǎn)品,單芯片性能可提高50%。官方的資料顯示,全新的Neoverse CCS V3 核心基于64核的Neoverse V3 核心,擁有6個(gè)DDR5 內(nèi)存控制器、4個(gè) I/O 控制器和兩個(gè)芯片間互連,并支持PCIe Gen5和CXL3.0。通過(guò)芯片間互聯(lián),可以升級(jí)至128核。相對(duì)于此前的 Neoverse CSS N2,其單芯片性能可提高50%。
除了核心的提升,Arm將繼續(xù)投入并進(jìn)一步強(qiáng)化軟件生態(tài)系統(tǒng),從而使開(kāi)發(fā)者能夠更加輕松地在?Arm平臺(tái)上構(gòu)建其應(yīng)用,并充分利用?Arm計(jì)算平臺(tái)所提供的卓越性能和效率優(yōu)勢(shì)。
結(jié)語(yǔ)
亞馬遜Graviton4處理器是Arm處理器歷史上的一次巨大成功,性能全面對(duì)標(biāo)x86處理器當(dāng)前的旗艦產(chǎn)品。在Graviton4處理器背后,Neoverse V2內(nèi)核起到了巨大的賦能作用,這讓產(chǎn)業(yè)界對(duì)于下一代基于Neoverse CCS V3 核心的Arm處理器更加期待。
-
處理器
+關(guān)注
關(guān)注
68文章
19896瀏覽量
235279
發(fā)布評(píng)論請(qǐng)先 登錄
在AWS Graviton4處理器上運(yùn)行大語(yǔ)言模型的性能評(píng)估

自主創(chuàng)新,安全可控:申威SW831處理器與國(guó)產(chǎn)終端產(chǎn)品推薦
RV1109處理器概述
面向NXP i.MX8處理器的電源解決方案

Arm Neoverse 驅(qū)動(dòng) AWS Graviton4,加速云計(jì)算新時(shí)代
Arm與AWS合作深化,AWS Graviton4展現(xiàn)顯著進(jìn)展
Arm Neoverse與AWS Graviton4加速云計(jì)算創(chuàng)新
SK-AM68處理器入門(mén)套件用戶(hù)指南

AM69處理器入門(mén)套件用戶(hù)指南

ADS8361與TMS470處理器的接口

ADS786x與TMS470處理器的接口

恩智浦i.MX8處理器的集成電源設(shè)計(jì)

基于全志V853處理器的智能輔助駕駛算法介紹

使用TPS6521815 PMIC為NXP i.MX 7處理器供電

評(píng)論