一年一度的國際超級計算大會(SupercomputingConference,以下簡稱SC)上,每次都有一個非官方的主題出現(xiàn)。過去兩年的焦點是機器學(xué)習(xí)(Machine learning)和深度學(xué)習(xí)(Deep learning),而在之前則是大規(guī)模數(shù)據(jù)密集計算,以及利用云重塑超級計算未來發(fā)展方向的潛力。
所有這些主題都有一個共同點,那就是:它們的重點都不是CPU處理器。實際上,它們都是圍繞X86架構(gòu)下的CPU性能提升或生態(tài)系統(tǒng)發(fā)展的相關(guān)話題?;叵胍幌?,近年來我們最后一次看到硬件設(shè)備成為大會的核心主題,還是在第一批大規(guī)模GPU超級計算機進入500強榜單時,然而它們只是加速器而不是設(shè)備的核心。
在今年的SC17上,核心處理器再次成為了非官方主題。基于ARM架構(gòu)的硬件和軟件生態(tài)系統(tǒng)進行了廣泛的演示,Cray等超級計算公司還展示了全面的系統(tǒng)集成效果,很多基準測試的結(jié)果足以與英特爾的最先進產(chǎn)品相抗衡。
基于ARM處理器的“Isambard”超級計算機將包含10,000個內(nèi)核(采用Cavium的ThunderX2 ARM處理器),將于明年在英國布里斯托大學(xué)面世,負責開發(fā)該超級計算機的團隊一直致力于基于ARM的HPC系統(tǒng)的研究和開發(fā)工作。我們現(xiàn)在看到,在基于大量開發(fā)工作鋪墊的ARM系統(tǒng)中,最著名的當屬巴塞羅那超級計算中心的Mont Blanc(幾年前開始采用雙Cortex-A15 ARM,現(xiàn)在基于Cavium ThunderX2 ARM處理器)。
McIntosh-Smith和他的團隊日前公布了一些很有意義的基準測試結(jié)果。這次基準測試采用了Cray 8節(jié)點設(shè)備集群和32核ThunderX2 ARM處理器,并與英特爾Skylake和Broadwell解決方案進行了對比。下面列出了在多種HPC應(yīng)用中進行對比的基準 -
McIntosh-Smith表示,總體而言,以內(nèi)存帶寬密集型的任何應(yīng)用都能夠在ThunderX2上很好地運行,性能顯著優(yōu)于 Skylake。然而對于偏向浮點密集型的應(yīng)用來說,因為Skylake使用了更寬的向量運算器所以會更勝一籌,但是ThunderX2 能與Broadwell平臺旗鼓相當。如果繼續(xù)增加高帶寬內(nèi)存,測試結(jié)果會怎么樣?這將會非常有趣。
基準測試結(jié)果請參見下圖:
內(nèi)存帶寬密集型的優(yōu)勢在OpenFOAM上的HPC應(yīng)用中體現(xiàn)得最為明顯——OpenFOAM是一種開源CFD應(yīng)用,通常更多地用于商業(yè)和科研領(lǐng)域的高性能計算。上圖的基準測試報告顯示,ThunderX2的OpenFOAM測試結(jié)果要好于Skylake 和 Broadwell 。
天氣和氣候模擬代碼也顯示內(nèi)存帶寬密集型應(yīng)用的性能會有同樣的提高。上圖顯示了在ThunderX2上測試英國氣象局(Met Office)的生產(chǎn)代碼的情況——Nemo是一種海洋模擬代碼。
“初步的結(jié)果顯示,對于GROMACS、CP2K和VASP等計算密集型的應(yīng)用,不同處理器之間的性能差距很小。而內(nèi)存帶寬密集型的應(yīng)用則可以顯著看出不同處理器之間的差異。這是因為,盡管這些代碼可受益于X86處理器的更廣泛向量單位,但ThunderX2可以借助更多內(nèi)核和更高的時鐘速度來進行補償,“McIntosh-Smith說。
隨著高端Cray XC50系統(tǒng)的面世,我們將在下一屆超級計算大會上看到基于ARM處理器的實際生產(chǎn)環(huán)境中的超級計算機的更多測試結(jié)果。
Isambard項目架構(gòu)請參見下圖:
直到今天,很多HPC ARM觀察家都知道Isambard是Cray的機型;但如果他們知道這家超級計算機生產(chǎn)商選擇了一條更加艱難的道路,將ThunderX2 ARM處理器與業(yè)內(nèi)著名的Aries互聯(lián)芯片相集成,并可以運行全套Cray軟件的話,很多人肯定會大吃一驚。相比較而言,如果把ThunderX2添加到CS Storm系列,而不是基于Aries的產(chǎn)品系列中,對Cray來說將簡單得多。但在McIntosh-Smith看來,這恰恰彰顯了Cray將ARM廣泛用于HPC領(lǐng)域的堅定決心。
McIntosh-Smith認為,將來不同的ARM選項可能會采用同一種專用的部署方法。“將來,基于ARM的HPC將增強向量功能,達到與其他CPU廠商不相上下的水平。下一代ARM產(chǎn)品將具有和任何其他廠商產(chǎn)品相當?shù)南蛄繉挾取!?/p>
有趣的一點是這些結(jié)果基于單純優(yōu)化內(nèi)核數(shù)量和基本條件后的編譯結(jié)果,只進行了幾個小時的微調(diào)。McIntosh-Smith表示,這些今天實現(xiàn)的突飛猛進,實際上是多年來在基于ARM的HPC系統(tǒng)上堅持不懈的努力結(jié)果。在硬件就緒后,ARM在HPC應(yīng)用中所需的軟件也會更快到位,隨著面向超級計算機的ARM處理器的正式上市,整個行業(yè)將迎來架構(gòu)改造的新紀元,ARM架構(gòu)將在HPC領(lǐng)域揭開廣泛處理器選擇的新篇章。
-
HPC
+關(guān)注
關(guān)注
0文章
341瀏覽量
24702
原文標題:HPC將迎來處理器變革新時代
文章出處:【微信號:icbank,微信公眾號:icbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Bricked Curiosity HPC無法進行編程
HPC-95PH
HITROL HPC-95P
HPC-100CT-2液位計
使用UMC 28HPC工藝進行MC仿真有什么問題嗎?
多ADC系統(tǒng)的基準電壓設(shè)計

評論