也許是受了神威太湖之光的刺激,或是其他什么原因,不久前,日本富士通發(fā)布PPT,要建設(shè)1000P超算,1000P超算是什么概念呢?神威太湖之光是100P超算,也就是說,Post-K的性能將會是神威太湖之光的10倍。
在神威太湖之光和天河2號相繼奪得TOP500第一名的情況下,日本富士通宣稱要建造計算性能是神威太湖之光10倍的超算——Post-K,而且日本富士通還聯(lián)合ARM為新超算開發(fā)處理器。把時間往回撥5年,日本京(K)也曾占據(jù)TOP500榜首。在聯(lián)合ARM解決了處理器的問題后,日本就能建成1000P超算么?
從K到Post-K
其實,日本超算也曾經(jīng)輝煌過,在2011年日本超算京(K)曾經(jīng)為例TOP500第一。日本超算“京”采用的處理器是富士通和甲骨文聯(lián)合研制的Sparc64-VIIIfx,Sparc64-VIIIfx是一款八核心處理器,主頻2.0GHz,峰值浮點性能128GFlops,Linpack測試的最大計算性能達到了10.51PFlops,也就是約為神威太湖之光的九分之一,雖然在現(xiàn)在來說,這個成績已經(jīng)比較一般了,但在2011年時候,還是稱雄一時的,位列TOP500榜首。
此外,在看重內(nèi)存帶寬和延遲的Graph500上,至今都有不俗的表現(xiàn)——2016年7月,在Graph500排行榜上,京連續(xù)第三次奪得冠軍,基準測試得分為38621GTEPS,排名第二的是中國的神威太湖之光,成績?yōu)?3756GTEPS。Graph500對全系統(tǒng)的內(nèi)存帶寬和內(nèi)存延遲有很高的要求,而計算能力本身已經(jīng)不影響測試結(jié)果了,這種測試偏向于訪存密集型運算,在大數(shù)據(jù)分析以及大規(guī)模圖表分析等場景下比較有意義。對于像神威太湖之光這樣專門針對特殊領(lǐng)域開發(fā)的超算,更加側(cè)重于Linpack性能,而在大規(guī)模圖表廣度優(yōu)先搜索方面非其所長,也不是神威太湖之光的主要應(yīng)用方向。
由于在財力上投入嚴重不足,日本在京之后,一直沒能拿出值得稱道的作品。不過,也許是受了神威太湖之光的刺激,或是其他什么原因,不久前,日本富士通發(fā)布PPT,要建設(shè)1000P超算,1000P超算是什么概念呢?神威太湖之光是100P超算,也就是說,Post-K的性能將會是神威太湖之光的10倍。
聯(lián)合ARM彌補處理器的不足
近年來,異構(gòu)超算已經(jīng)是大勢所趨,什么是異構(gòu)超算呢?異構(gòu)計算就是用不同的計算單元組成系統(tǒng)的計算方式,簡單的公式可以表示為“CPU+XXX”,在超算上已經(jīng)廣泛采用,比如天河2號就是CPU+眾核加速器,天河2A就是CPU+GPDSP,美國超算泰坦就是CPU+GPGPU。從中可以看出,在異構(gòu)超算已經(jīng)是大勢所趨,而且能夠取得更高的性能的情況下,要建設(shè)性能強悍的超算,如果沒有高性能的加速器顯然是不切實際的——眾所周知,神威太湖之光之所以能夠取得100P的性能,很大程度上得益于申威26010處理器的強悍性能。目前,日本富士通的京是一款同構(gòu)超算,采用了Sparc64-VIIIfx處理器,在沒有自己的眾和處理器做加速器的情況下,日本富士通聯(lián)合ARM開發(fā)加速器也就理所當然了。
可能有人會疑惑了,ARM不是做手機、平板用的SOC么,怎么還能做超算?雖然ARM一直在嵌入式芯片上深耕,但也一直試圖進入低功耗服務(wù)器市場,雖然在Intel至強D的阻擊下斬獲有限,但確實給那些多年來苦于Intel的廠商另外一個選擇。
在幾個月前,ARM還發(fā)布了矢量擴展架構(gòu)(SVE)——矢量擴展架構(gòu)可以提升向量,這意味著可以提升并行度。而向量既有定點也有浮點,面向的是大型數(shù)據(jù)處理的需要。雖然對于服務(wù)器和超算而言,光靠向量還是不行的,但卻比沒有矢量擴展架構(gòu)要強。而這次富士通聯(lián)合ARM,顯然是為了解決超算處理器的問題,而且和申威26010和Intel的KNL一樣,富士通聯(lián)合ARM開發(fā)的處理器很可能也會是一款眾核處理器。
超算的核心技術(shù)并不只有CPU
即便有了強悍的處理器,就能輕而易舉地建成世界第一的超算么?其實,事情遠遠不止這么簡單。
社會上一直有一種流言,就是只要有足夠多、性能足夠強的處理器,就能做出世界第一的超算。但實際上,這種觀點是非常值得商榷的。超算是一個系統(tǒng),而并非是處理器的堆砌。
超算系統(tǒng)可以分為軟件系統(tǒng)和硬件系統(tǒng)兩部分。超級計算機硬件系統(tǒng)主要由運算系統(tǒng)、互連系統(tǒng)、存儲系統(tǒng)、維護監(jiān)控系統(tǒng)、電源系統(tǒng)、冷卻系統(tǒng)和結(jié)構(gòu)組裝設(shè)計等部分組成。運算系統(tǒng)負責邏輯復雜的調(diào)度和串行任務(wù),以及并行度高的任務(wù)?;ミB網(wǎng)絡(luò)將所有計算節(jié)點連接起來,使其成為一個整體。存儲系統(tǒng)負責數(shù)據(jù)交換和儲存。維護監(jiān)控系統(tǒng)保障超算不死機、不出錯。電源系統(tǒng)包裝能源供應(yīng)。冷卻系統(tǒng)幫助超算降溫。結(jié)構(gòu)組裝設(shè)計是將上述系統(tǒng)裝載到一起,在保障性能的基礎(chǔ)上,實現(xiàn)機柜體積最小。超級計算機軟件系統(tǒng)主要包括操作系統(tǒng)、編譯系統(tǒng)、并行程序開發(fā)環(huán)境、科學計算可視化系統(tǒng)等重要組成部分。
由此可見,運算系統(tǒng)、存儲系統(tǒng)、互聯(lián)系統(tǒng)、操作系統(tǒng)、基礎(chǔ)庫、應(yīng)用軟件等都是超算的重要組成部分,將CPU等同于超算的全部技術(shù)的說法顯然是非常不科學的。
有了處理器未必就能建成1000P超算
由于日本經(jīng)濟在廣場協(xié)議之后一直保持在低迷的狀態(tài),加上超算本來就屬于偏向國家工程的項目,而且相對較少的建造量和昂貴的價格都很難讓私人公司通過超算獲取高額利潤,在研發(fā)成本過于高昂的情況下,使得日本NEC、日立等大公司先后退出超算研發(fā)領(lǐng)域,唯有富士通還在苦苦支撐,而且日本政府的支持相當不給力——京的研發(fā)經(jīng)費一度遭到凍結(jié),直到數(shù)位日本科學家聯(lián)名向時任日本首相鳩山由紀夫上書陳明厲害關(guān)系,京的研發(fā)經(jīng)費才解凍.....對于向政府謀取經(jīng)費以支持新超算研發(fā)的科學家,日本華裔女政客蓮舫(中國***籍,原名謝蓮舫,就是在11月24日在參議院《跨太平洋伙伴關(guān)系協(xié)定》(TPP)特別委員會上對安倍晉三窮追猛打的那位)甚至反問道:“當老二有什么不好?”
正是在這種大環(huán)境下,使得在過去幾年,中國超算技術(shù)突飛猛進,而日本卻沒有制造出比京更好的超算。要知道,技術(shù)發(fā)展有其規(guī)律,是一步一個腳印迭代演進的,大躍進式一口吃成一個胖子的做法并不可取。
正是在過去幾年缺課太多的情況下,哪怕日本富士通可以聯(lián)合ARM解決處理器的問題,但也要面對互聯(lián)、存儲、軟件等一系列問題。就以互聯(lián)網(wǎng)絡(luò)來說,由于超算的計算節(jié)點之間傳輸?shù)臄?shù)據(jù)量巨大,延遲要求嚴格,當互聯(lián)網(wǎng)絡(luò)拖后腿的情況下,就會造成數(shù)據(jù)擁堵,大幅降低超算整機系統(tǒng)效率。而且超算的規(guī)模越大,對互聯(lián)網(wǎng)絡(luò)的要求也就越高。正是因為高速互聯(lián)網(wǎng)絡(luò)的重要性,美國早就將高速互聯(lián)網(wǎng)絡(luò)列入對中國技術(shù)封鎖的名單。而日本在Post-K之前,K的計算性能只有10P,從10P迅速跨越到1000P,如果不謀求從美國獲取技術(shù),這對于富士通來說未必不是一個挑戰(zhàn)。
日本政府和理化所的表態(tài)相對理智現(xiàn)實
事實上,相對于富士通1000P超算的PPT,日本文部科學省和日本理化所的表態(tài)則謹慎的多,在2016年,日本文部科學省發(fā)表了后續(xù)基本設(shè)計方針:“在發(fā)展方針中,日本文部科學省不再追求世界第一的計算速度,而是將目標由加快計算速度轉(zhuǎn)向了加強節(jié)能及便捷功能”。在美國鹽湖城SC16全球超算大會期間召開的第14屆HPC Connection Workshop中外超算高峰論壇(HPCC)上,日本理化所Mitsuhisa Sato透露了日本發(fā)展E級超算的“旗艦2020計劃”,將在2017年4月投入運營Post K超級計算機,其系統(tǒng)峰值性能約為25P, 1000P超算的升級計劃被排到了2020年。值得關(guān)注的是Post K的功耗為3.6兆瓦,性能功耗比接近神威太湖之光的水平,確實將日本建造最節(jié)能超算的計劃付諸于實踐。但從曾經(jīng)追求計算性能最強超算,到如今的追求最節(jié)能超算,想必日本從事超算建設(shè)的工程師們心中除了無奈只有苦笑吧。
在富士通以前,也有很多科技公司的PPT也非常漂亮,PPT上的技術(shù)指標更是華麗無比,但產(chǎn)品上市后實際表現(xiàn)卻判若兩人。因此,PPT上的紙面技術(shù)指標是一回事,能不能把1000P超算造出來就是另外一回事了。退一步說,即便日本將來真的建成了1000P的Post-K超算,但技術(shù)上的大躍進必然會拉長研發(fā)周期,使日本的1000P超算將會晚于中國的1000P超算問世。
評論