一家英國(guó)芯片初創(chuàng)公司推出了它聲稱是世界上最復(fù)雜的AI芯片Colossus MK2或GC200 IPU(智能處理單元)。Graphcore將其MK2與Nvidia的適用于AI應(yīng)用的Ampere A100 GPU進(jìn)行對(duì)比。
MK2及其前身MK1專為處理非常大型的機(jī)器學(xué)習(xí)模型而設(shè)計(jì)。MK2處理器具有1,472個(gè)獨(dú)立的處理器核心和8,832個(gè)獨(dú)立的并行線程,所有這些均由900MB的處理器內(nèi)RAM支持。
Graphcore表示,MK2的BERT-Large訓(xùn)練性能比MK1改進(jìn)了9.3倍,BERT-3Layer推理性能提高了8.5倍,EfficientNet-B3培訓(xùn)的性能提高了7.4倍。
BERT,即來自變壓器的雙向編碼器表示形式,是Google為基于自然語言的搜索而開發(fā)的自然語言處理預(yù)訓(xùn)練技術(shù)。
Graphcore不僅會(huì)提供芯片。對(duì)于一家相對(duì)較新的創(chuàng)業(yè)公司(成立于2016年),Graphcore圍繞其芯片構(gòu)建了卓越的生態(tài)系統(tǒng)。大多數(shù)芯片初創(chuàng)公司只關(guān)注其硅片,但是Graphcore提供了更多的東西。
它通過其新的IPU機(jī)器M2000出售GC200,該IPU機(jī)器M2000在1U盒中包含四個(gè)GC200芯片,并提供1 petaflop的總計(jì)算能力。Graphcore指出,您可以從直接連接到現(xiàn)有x86服務(wù)器的單個(gè)IPU-Machine M2000盒子開始,或者添加總共八個(gè)連接到一臺(tái)服務(wù)器的IPU-Machine M2000。對(duì)于大型系統(tǒng),它提供IPU-POD64,其中包括內(nèi)置在標(biāo)準(zhǔn)19英寸機(jī)架中的16臺(tái)IPU-Machine M2000。
通過Graphcore的全新IPU-Fabric技術(shù)可以大規(guī)模連接IPU-Machine M2000和IPU-POD,該技術(shù)是專為機(jī)器智能通信而設(shè)計(jì)的,并提供了專用的低延遲結(jié)構(gòu),可以在整個(gè)數(shù)據(jù)中心連接IPU。
Graphcore的Virtual-IPU軟件與工作量管理和編排軟件集成在一起,可為許多不同的用戶提供培訓(xùn)和推理服務(wù),并且它允許對(duì)可用資源進(jìn)行調(diào)整,并根據(jù)工作進(jìn)行重新配置。
這家初創(chuàng)公司表示,其新硬件完全是即插即用的,客戶將能夠?qū)⒍噙_(dá)64,000個(gè)IPU連接在一起,總共擁有16 exaFLOP的計(jì)算能力。
這是一個(gè)很大的要求。英特爾,ARM,AMD,富士通和Nvidia仍在朝著exaflop的目標(biāo)邁進(jìn),而Graphcore聲稱是后者的16倍。
Graphcore的另一個(gè)關(guān)鍵要素是其Poplar軟件堆棧,該堆棧由IPU從頭開始設(shè)計(jì),并與標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)框架完全集成,因此開發(fā)人員可以輕松移植現(xiàn)有模型,并在熟悉的環(huán)境中快速啟動(dòng)并運(yùn)行。對(duì)于希望完全控制以利用IPU發(fā)揮最大性能的開發(fā)人員,Poplar支持使用Python和C ++直接進(jìn)行IPU編程。
Graphcore有一些重要的MK2系統(tǒng)早期采用者,包括牛津大學(xué),美國(guó)能源部的勞倫斯·伯克利國(guó)家實(shí)驗(yàn)室和JP Morgan,后者致力于自然語言處理和語音識(shí)別。
IPU-Machine M2000和IPU-POD64系統(tǒng)現(xiàn)已開始預(yù)訂,并于2020年第四季度開始批量生產(chǎn)。早期訪問客戶可以通過Graphcore的云合作伙伴Cirrascale在云中評(píng)估IPU-POD系統(tǒng)。它計(jì)劃在未來幾個(gè)月內(nèi)宣布OEM和渠道合作伙伴。
-
處理器
+關(guān)注
關(guān)注
68文章
19896瀏覽量
235326 -
芯片
+關(guān)注
關(guān)注
460文章
52520瀏覽量
441122 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134642
發(fā)布評(píng)論請(qǐng)先 登錄
開環(huán)霍爾電流傳感芯片GC1868產(chǎn)品介紹

先鋒打碟機(jī)CDJ-1000MK2圖紙
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......
AI在芯片上的應(yīng)用:革新設(shè)計(jì)與功能
GaNSafe–世界上最安全的GaN功率半導(dǎo)體

transformer專用ASIC芯片Sohu說明

ASIC芯片會(huì)成為AI的下一件大事嗎

AI時(shí)代下芯片復(fù)雜度飆升,思爾芯國(guó)產(chǎn)硬件仿真加速芯片創(chuàng)新

世界上最貴的錫膏-金錫(Au80Sn20)

NVIDIA Colossus超級(jí)計(jì)算機(jī)集群突破10萬顆Hopper GPU
NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

評(píng)論