電子發(fā)燒友網(wǎng)報道(文/吳子鵬)2021年一月,上海天數(shù)智芯半導體有限公司(以下簡稱:天數(shù)智芯)宣布,公司旗艦7nm工藝GPGPU云端訓練芯片BI成功點亮,這是國內(nèi)第一款全自研、真正基于GPU架構(gòu)下的7nm工藝GPGPU訓練芯片。
緊接著,2021年3月31日,天數(shù)智芯正式對外發(fā)布全自研高性能云端7nm芯片BI及產(chǎn)品卡,實現(xiàn)國產(chǎn)云端高性能GPGPU芯片從0到1的突破。在算力方面,天數(shù)智芯BI產(chǎn)品單芯每秒可進行147萬億次FP16計算(147TFLOPS@FP16)。
天數(shù)智芯在BI產(chǎn)品“點亮”時提到,BI產(chǎn)品的理論峰值性能達市場主流產(chǎn)品的2倍。一時間,國產(chǎn)GPGPU似乎已經(jīng)站在世界之巔。但天數(shù)智芯產(chǎn)品副總裁鄒翾在接受電子發(fā)燒友采訪時表示:“實測性能對用戶才是關鍵,目前國內(nèi)的軟件生態(tài)是短板,幾乎90%的AI應用都基于國外的基礎軟件棧,如何在現(xiàn)有軟件生態(tài)上充分發(fā)揮芯片的計算力,提供優(yōu)秀的實測性能,這是國產(chǎn)GPGPU 發(fā)展的關鍵?!?/p>
減少客戶遷移的成本
軟件的重要性是毋庸置疑的,是發(fā)揮GPGPU硬件潛力的必要一環(huán),讓抽象的算力資源能夠和具體應用深度結(jié)合。目前,在GPGPU領域,無論是CUDA/OpenCL/TensorRT這些硬件加速平臺,還是TensorFlow/PyTorch等主流深度學習開發(fā)框架,主導者都是國際廠商或機構(gòu)。鄒翾認為:“自己的軟件平臺一定是需要的,但目前來說,我們與國外主流廠商還有比較大的差距。而且不能單從某一顆芯片上去對比,還包括產(chǎn)品的覆蓋范圍、生態(tài)等方面。尤其是生態(tài)建設,這是國內(nèi)廠商必須要面對的問題?!?/p>
他還說到,國內(nèi)企業(yè)一定要敢于承認這種差距,在解決這些問題以后,國內(nèi)的運算平臺才會有真正的用武之地。我們企業(yè)還是要圍繞怎么解決用戶需求去發(fā)展,在這個過程中不斷追趕并縮小這種差距。。
在天數(shù)智芯的系統(tǒng)軟件方案中有標注,該公司除了提供高效的全棧式解決方案和全套SDK,也強調(diào)API兼容業(yè)界主流生態(tài)以及無痛遷移?!疤峁└咝实能浖Y(jié)構(gòu),最大限度降低已有客戶的開發(fā)遷移成本,極大地影響著整個產(chǎn)業(yè)的發(fā)展。” 鄒翾指出,“天數(shù)智芯在產(chǎn)品的設計之初就關注到,客戶需要最大限度降低跨平臺的開發(fā)成本。我們考慮到GPGPU產(chǎn)品架構(gòu)的通用兼容性,本著以客戶需求為出發(fā)點的原則,從實際角度為客戶實現(xiàn)跨平臺轉(zhuǎn)換的無痛遷移。”
從云端走向更廣闊的場景
在天數(shù)智芯BI產(chǎn)品的介紹中我們看到,這款全自研通用計算GPGPU芯片聚焦于云端訓練市場。長期以來,云端訓練市場被國際巨頭壟斷,不僅加速卡產(chǎn)品成本高,且生態(tài)較為封閉,制約了AI產(chǎn)品多元化發(fā)展和升級迭代。
鄒翾介紹說,BI產(chǎn)品是國內(nèi)第一款全自研、真正基于通用GPU架構(gòu)的GPGPU云端高端訓練芯片,以比同類產(chǎn)品更小的芯片面積 、更低的功耗,提供主流廠商實測接近的性能??偨Y(jié)而言,BI產(chǎn)品有以下幾個優(yōu)勢:
全自研IP核心;
GPGPU架構(gòu),更具有通用性及靈活性;
采用先進的 7nm工藝制程,性能效率高,在同樣的 power水平上性能更高;
軟件對主流生態(tài)兼容,客戶的跨平臺開發(fā)成本更低。
作為一種通用計算芯片,云端訓練只是GPGPU典型的應用場景之一,正如NVIDIA所言,GPGPU最終的目的是將AI引入到各行各業(yè)中。鄒翾也談到:“我們做的GPGPU全稱是通用圖形處理器(General-Purpose Computing on Graphics Processing Units),就是讓本為圖形圖像處理而生的GPU能夠運行圖形渲染之外的通用計算任務?!?/p>
在采訪的過程中,我們談到了端側(cè)AI的應用。鄒翾表示,GPU在端到端AI部署中,屬于一個已經(jīng)被驗證的芯片架構(gòu)。AI端側(cè)發(fā)展會驅(qū)動應用背后更多新型函數(shù)和新型算子的出現(xiàn),這些需求將被融合到GPU未來的軟硬件開發(fā)中。
下面這段引述是他對于GPGPU在與各類型AI芯片相比特點的總結(jié):GPGPU的設計特點在于其通用可編程性,對于層出不窮的新的算法和應用,能做到性能和開發(fā)成本間較好的平衡。同時,基于GPGPU的通用性,客戶可以在類似軟硬件架構(gòu)間的產(chǎn)品間進行應用的無痛遷移。
在GPGPU領域,NVIDIA無疑是行業(yè)的標桿,不僅擁有百萬開發(fā)者支持的CUDA,還在指令集的覆蓋面、顆粒度、效率等維度有領先優(yōu)勢,再考慮到產(chǎn)業(yè)生態(tài),國產(chǎn)GPGPU替代還有很長的路要走。在NVIDIA官網(wǎng)有提到,AI應用不僅需要大的內(nèi)存池,也需要CPU和GPU緊密耦合。
對于這一點,鄒翾認為,GPU注重的是同類型的數(shù)據(jù)按照同樣的處理流程進行高效并行處理,CPU的優(yōu)勢是處理復雜邏輯流程。CPU和GPU在一個芯片上是可以實現(xiàn)的,而且以前也存在這種整合性的產(chǎn)品,但是對于高端的、云端的CPU加上GPU同時實現(xiàn),需要非常大的尺寸規(guī)模,而且會限制芯片在各自領域的性價比。
天數(shù)智芯的下一步
艾瑞咨詢此前在相關報告中指出,2020年中國人工智能基礎層市場規(guī)模為497億元,為AI產(chǎn)業(yè)總規(guī)模的33%,AI芯片的高增長是產(chǎn)業(yè)規(guī)模增長的主要推動力。未來,算力模塊的智能服務器國產(chǎn)化率將逐步提升。
毫無疑問,云端訓練在未來很長一段時間內(nèi)仍將是AI芯片的主要市場,市場占比會一直處于前列。但正如鄒翾所言,隨著AI、5G技術的持續(xù)發(fā)展與應用落地,端側(cè)及邊緣側(cè)未來對算力性能的要求會越來越大。其中,數(shù)據(jù)中心以及金融、電信等方面將會是很大的市場。
他表示:“目前天數(shù)智芯的產(chǎn)品是云端7nm通用計算芯片BI及加速卡,未來公司將聚焦GPGPU領域的高通用性及更廣闊的應用領域。天數(shù)智芯始終以市場需求為導向,結(jié)合公司技術優(yōu)勢,關注客戶需求痛點并推出適合的GPGPU產(chǎn)品。隨著城市數(shù)字化轉(zhuǎn)型,傳統(tǒng)行業(yè)智能化轉(zhuǎn)型升級需求逐漸擴大,5G、大數(shù)據(jù)中心、人工智能、工業(yè)物聯(lián)網(wǎng)、無人駕駛、智慧城市等眾多智能應用領域?qū)Ω叨薌PGPU芯片產(chǎn)品的需求量都在急劇增加。”
2021年3月1日,天數(shù)智芯對外宣布完成12億元人民幣的C輪融資。在企業(yè)高速發(fā)展的過程中,除了資金要到位,人才是重中之重?!疤鞌?shù)智芯目前已經(jīng)擁有了一支全球頂尖的數(shù)字集成電路設計與基礎軟件設計科學家團隊,為實現(xiàn)公司‘做算力引擎,創(chuàng)世界一流’的愿景而砥礪前行。
這支完整的GPGPU研發(fā)團隊,由公司聯(lián)合創(chuàng)始人、高級副總裁及首席科學家鄭金山先生帶領,占比公司總?cè)藬?shù)85%以上,這其中既有一批行業(yè)經(jīng)驗超過20年的世界級技術專家,也有一大批擁有5-15年業(yè)界經(jīng)驗的高執(zhí)行力技術菁英,亦不乏來自于全球頂級院校的博士?!?/p>
鄒翾對此講到,“按照公司的業(yè)務發(fā)展,我們將會持續(xù)不斷地吸納優(yōu)秀人才深耕國產(chǎn)GPGPU芯片設計。隨著新產(chǎn)品的推出,團隊也將進一步擴大。另外,根據(jù)我們產(chǎn)品規(guī)劃和市場發(fā)展需要,天數(shù)智芯也會進一步通過融資支持公司的長遠發(fā)展?!?/p>
聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱huangjingjing@elecfans.com。
編輯:jq
-
芯片
+關注
關注
462文章
53179瀏覽量
453704 -
NVIDIA
+關注
關注
14文章
5431瀏覽量
108260 -
gpu
+關注
關注
28文章
5035瀏覽量
133730 -
AI
+關注
關注
88文章
37012瀏覽量
290007 -
SDK
+關注
關注
3文章
1091瀏覽量
50653
原文標題:正視差距,國產(chǎn)GPGPU的進階之路
文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
傾佳電子SiC碳化硅功率器件戰(zhàn)略市場精通指南:從業(yè)者進階之路

嵌入式從入門到進階,怎么學?
舵機原理簡述!
嵌入式工程師的進階之路
貞光科技觀察 | 紫光同芯THA6國產(chǎn)車規(guī)MCU突圍之路

芯原可擴展的高性能GPGPU-AI計算IP賦能汽車與邊緣服務器AI解決方案
國產(chǎn)濾波器,如何破局!
RK3568驅(qū)動指南|驅(qū)動基礎進階篇-進階7 向系統(tǒng)中添加一個系統(tǒng)調(diào)用

Altium Designer PCB設計高級進階
【國產(chǎn)FPGA入學必備】刀劍在鞘,兵器先藏 | 盤古676系列國產(chǎn)FPGA開發(fā)板
國產(chǎn)主板的崛起之路代表著我們的科技實力和創(chuàng)新能力
國芯科技:已結(jié)束基于RISC-V架構(gòu)GPGPU研發(fā)
中科銀河芯的國產(chǎn)替代之路

評論