隨著人工智能和云計(jì)算等技術(shù)的不斷發(fā)展,處理器需要處理的數(shù)據(jù)量越來(lái)越大,對(duì)性能和效率的要求也越來(lái)越高。另一方面,摩爾定律逼近極限,在過(guò)去十幾年中,單個(gè)處理器中晶體管數(shù)目的增加速度逐漸放緩,芯片工藝制程接近1nm時(shí),開(kāi)始接觸到量子效應(yīng)的極限。
當(dāng)制造工藝很難再發(fā)展的時(shí)候,人們更多是希望在處理器架構(gòu)設(shè)計(jì)多下功夫,以提高計(jì)算效率,NUMA架構(gòu)應(yīng)運(yùn)而生。本篇文章,跟大家介紹一下,什么是NUMA架構(gòu)?
早期的時(shí)候,每臺(tái)服務(wù)器都是單CPU,隨著技術(shù)的發(fā)展,出現(xiàn)了多CPU共同工作的需求。NUMA(Non-Uniform Memory Access,非一致性?xún)?nèi)存訪問(wèn))和SMP(Symmetric Multi-Processor,對(duì)稱(chēng)多處理器系統(tǒng))是兩種不同的解決多CPU共同工作的硬件體系架構(gòu)。
SMP架構(gòu)是比較常見(jiàn)的多CPU構(gòu)建方式。其主要特征是共享,所有的CPU共享使用全部資源,例如內(nèi)存、總線和I/O,多個(gè)CPU對(duì)稱(chēng)工作,彼此之間沒(méi)有主次之分,平等地訪問(wèn)共享的資源。但是缺點(diǎn)也顯而易見(jiàn),這樣勢(shì)必引入資源的競(jìng)爭(zhēng)問(wèn)題,隨著核數(shù)增多,內(nèi)存控制器讀取內(nèi)存的性能瓶頸越來(lái)越明顯,從而導(dǎo)致它的擴(kuò)展內(nèi)力非常有限。
為了解決這個(gè)問(wèn)題,硬件設(shè)計(jì)師們將內(nèi)存控制器平分到每個(gè) die上,從而形成了NUMA 架構(gòu)。
NUMA架構(gòu)通過(guò)將CPU劃分成不同的組(Node),每個(gè)Node由一個(gè)或多個(gè)(物理)CPU組成,并且有獨(dú)立的本地內(nèi)存、I/O等資源。在NUMA架構(gòu)中,每個(gè)節(jié)點(diǎn)都有自己的內(nèi)存和計(jì)算資源,這使得處理器可以更靈活地分配資源,提高了整體性能和效率。此外,NUMA架構(gòu)還可以通過(guò)增加節(jié)點(diǎn)數(shù)量來(lái)擴(kuò)展處理器的計(jì)算和存儲(chǔ)能力,這使得它成為一種非常適合大規(guī)模并行處理的架構(gòu)。
目前業(yè)界都認(rèn)為摩爾定律接近極限,NUMA技術(shù)是CPU發(fā)展的一種必然趨勢(shì)。
摩爾定律是由英特爾(Intel)創(chuàng)始人之一戈登·摩爾(Gordon Moore)提出來(lái)的。其內(nèi)容為:當(dāng)價(jià)格不變時(shí),集成電路上可容納的晶體管數(shù)目,約每隔18-24個(gè)月便會(huì)增加一倍,性能也將提升一倍。換言之,處理器的性能大約每?jī)赡攴槐?,同時(shí)價(jià)格下降為之前的一半。
然而,在過(guò)去十幾年中,單個(gè)處理器中晶體管數(shù)目的增加速度逐漸放緩,促使許多廠商推出雙核及多核計(jì)算機(jī)。在這樣的背景下,NUMA架構(gòu)處理器可帶來(lái)更高的性能、核心密度和能效,也會(huì)適用于更廣泛的計(jì)算環(huán)境。
說(shuō)了這么多,NUMA架構(gòu)處理器表現(xiàn)如何?國(guó)內(nèi)外都哪些品牌采用了多NUMA架構(gòu)的方式去設(shè)計(jì)處理器?
(1)AMD
AMD 的“Zen”架構(gòu)帶來(lái)全新的處理器設(shè)計(jì),較原來(lái)的 AMD “推土機(jī)”架構(gòu)實(shí)現(xiàn)了大幅的性能提升。“Zen”有三大目標(biāo) — 卓越的性能、非凡的可擴(kuò)展性以及出色的能效。
為實(shí)現(xiàn)出色的可擴(kuò)展性,AMD 在處理器中大膽采用全新理念:小芯片。AMD 沒(méi)有構(gòu)建更大、更昂貴的單片芯片,而是采取了稱(chēng)為小芯片的處理器構(gòu)建塊。每個(gè)小芯片都包含許多基于“Zen”的核心,而且封裝的小芯片越多,處理器性能就越強(qiáng)。目前,“Zen”處理器的核心數(shù)少則兩個(gè),多則 128 個(gè)。這種創(chuàng)新為消費(fèi)者帶來(lái)可擴(kuò)展性和靈活性。
AMD Zen架構(gòu)誕生于2017年,迄今已經(jīng)先后有了14nm Zen、12nm Zen+、7nm Zen 2、7nm Zen 3,以及現(xiàn)有的已應(yīng)用于AMD 4代服務(wù)器的5nm Zen 4Genoa處理器產(chǎn)品。比如,早期的zen1如下圖所示4個(gè)numa的結(jié)構(gòu)
AMD官網(wǎng)上展示的zen4的多numa架構(gòu)
從AMD的產(chǎn)品路線圖上可以發(fā)現(xiàn),采用多NUMA的架構(gòu)設(shè)計(jì),能擴(kuò)展更多的物理Core,提供更強(qiáng)的性能,例如:從zen1的32物理核,到zen2/3的64物理核,雖然zen2采用7nm制程,但是多NUMA方式讓zen2集成更多的核心,性能也是提升2+倍不止。
型號(hào) | 核心數(shù) | 線程數(shù) |
基頻 (GHz) |
最高加速頻率 (Ghz) |
CPU2017 Integer Rates |
Zen1 7551 | 32 | 64 | 2.0 | 3.0 | 136 |
Zen2 7662 | 64 | 128 | 2.0 | 3.3 | 335 |
目前最新發(fā)布的zen4多達(dá)96核,多NUMA架構(gòu)的方式讓處理器可帶來(lái)更高的性能、更高的核心密度和更低的能效。從AMD的產(chǎn)品路線圖上,AMD一直在多NUMA上設(shè)計(jì),產(chǎn)品性能也是遙遙領(lǐng)先。
(2)Intel
英特爾今年創(chuàng)新推出的Sapphire Rapids,也為下一代數(shù)據(jù)中心處理器樹(shù)立了標(biāo)準(zhǔn)參考。
據(jù)英特爾Linux工程師Andi Kleen提交的內(nèi)核補(bǔ)丁可知,Sapphire Rapids將采用Golden Cove架構(gòu)核心,而不是目前Tiger Lake使用的Willow Cove架構(gòu)核心,這意味著Sapphire Rapids將于即將到來(lái)的Alder Lake擁有同款架構(gòu)核心。Sapphire Rapids芯片采用了與AMD霄龍服務(wù)器處理器類(lèi)似的“膠水”設(shè)計(jì),4個(gè)MCM小芯片有望提供多達(dá)80個(gè)CPU核心,單顆處理器則由4個(gè)NUMA組成。
英特爾在2023年推出了至強(qiáng)鉑金 8490H 是一款 60 核服務(wù)器/工作站處理器,四個(gè)DIE(NUMA)的實(shí)現(xiàn)方式。通過(guò)lscpu可以看到9490H單顆處理器4個(gè)NUMA結(jié)構(gòu)。
(3)海光
在海光官網(wǎng)上直觀的看到海光也是4NUMA的設(shè)計(jì),同時(shí),在現(xiàn)有的服務(wù)器驗(yàn)證結(jié)果來(lái)看,海光確實(shí)是4NUMA結(jié)構(gòu),并且在高頻計(jì)算方面表現(xiàn)在同行業(yè)中表現(xiàn)出眾,海光在國(guó)內(nèi)市場(chǎng)也已經(jīng)擠進(jìn)主流處理器的行列中。
在NUMA架構(gòu)技術(shù)加持下,海光在諸多場(chǎng)景下都能發(fā)揮出性能優(yōu)勢(shì)。
如在數(shù)據(jù)庫(kù)管理系統(tǒng)領(lǐng)域,在大量讀寫(xiě)的數(shù)據(jù)庫(kù)操作中,NUMA架構(gòu)可以顯著提高數(shù)據(jù)庫(kù)的性能,許多數(shù)據(jù)庫(kù)管理系統(tǒng),如Oracle、MySQL等,支持NUMA架構(gòu),可以利用NUMA特性進(jìn)行優(yōu)化;在科學(xué)計(jì)算領(lǐng)域,常常需要處理大量的數(shù)據(jù),使用NUMA架構(gòu)可以提高處理器的內(nèi)存訪問(wèn)速度,從而提高整體性能;在服務(wù)器應(yīng)用領(lǐng)域,NUMA架構(gòu)可以幫助平衡負(fù)載,提高服務(wù)器的整體性能;在云計(jì)算領(lǐng)域,NUMA架構(gòu)可以用于平衡虛擬機(jī)的資源分配,從而提高整個(gè)云環(huán)境的性能。
據(jù)說(shuō),海光四號(hào)將采用Chiplet技術(shù),在原有的NUMA架構(gòu)上,進(jìn)一步優(yōu)化互聯(lián)技術(shù)、提升計(jì)算能力。海光不斷的技術(shù)創(chuàng)新,以持續(xù)自研迭代,帶來(lái)好用、易用的國(guó)產(chǎn)處理器。
綜上所述,NUMA架構(gòu)是處理器發(fā)展的一個(gè)重要趨勢(shì),產(chǎn)品表現(xiàn)相對(duì)而言是不錯(cuò)的。當(dāng)然,技術(shù)發(fā)展都是任重道遠(yuǎn)的,未來(lái)處理器架構(gòu)的發(fā)展,還需要不斷的創(chuàng)新優(yōu)化,以克服未知的挑戰(zhàn)。
審核編輯:劉清
-
處理器
+關(guān)注
關(guān)注
68文章
20066瀏覽量
242622 -
云計(jì)算
+關(guān)注
關(guān)注
39文章
7992瀏覽量
142058 -
人工智能
+關(guān)注
關(guān)注
1811文章
49488瀏覽量
258052 -
numa
+關(guān)注
關(guān)注
0文章
7瀏覽量
3978
原文標(biāo)題:NUMA架構(gòu)或?qū)⒊蔀槲磥?lái)處理器發(fā)展趨勢(shì)
文章出處:【微信號(hào):算力基建,微信公眾號(hào):算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
AI工藝優(yōu)化與協(xié)同應(yīng)用的未來(lái)發(fā)展趨勢(shì)是什么?

人工智能技術(shù)的現(xiàn)狀與未來(lái)發(fā)展趨勢(shì)
物聯(lián)網(wǎng)未來(lái)發(fā)展趨勢(shì)如何?
龍芯處理器支持WINDOWS嗎?
GPU架構(gòu)深度解析

技術(shù)分享 | 如何在2k0300(LoongArch架構(gòu))處理器上跑通qt開(kāi)發(fā)流程

評(píng)論