人工智能芯片戰(zhàn)局暗潮洶涌,當 Google 與 NVIDIA 戰(zhàn)火交纏于云端 AI ,更往下蔓延至邊緣 AI 戰(zhàn)場時,華為宣布“達芬奇”架構,提出 MindSpore 計算框架,一舉橫跨公有云、私有云、端、邊緣等,這一步,讓國內(nèi)人工智能技術實力提升至另一個層次。
達芬奇,歐洲文藝復興時期最完美的代表,也是人類歷史上絕無僅有的全才,他是科學家、發(fā)明家、建筑工程師,也是畫家。華為借“達芬奇”這個化身與命名,透露出 AI 戰(zhàn)略布局的光芒與野心。
華為 2018 全聯(lián)接大會上,副董事長兼輪值董事長徐直軍為華為的 AI 戰(zhàn)略作出定義:全棧全場景 AI 解決方案。
所謂“全棧”,是指在芯片設計、芯片算子庫和高度自動化算子開發(fā)工具 CANN 、統(tǒng)一訓練推理計算框架 MindSpore 、全流程服務(ModelArts)一體到位。
“全場景”則是指將 AI 應用到橫跨公有云、私有云、各種邊緣計算、各種終端環(huán)境的場景進行部署,尤其是應用到華為已有的業(yè)務領域包括智能手機、榮耀手機、智能家電、華為云等,包括面向企業(yè)和政府的人工智能服務平臺華為云 EI ,以及面向智能終端的人工智慧引擎 HiAI 已經(jīng)為大量開發(fā)者、消費者及企業(yè)提供豐富的 AI 服務。
(來源:華為)
華為芯片布局:為 AI 而生
時光回到 2017 年,華為推出首顆手機端人工智能芯片麒麟 970,首次實現(xiàn)在端側嵌入專用 NPU ,打響人工智能芯片落地智能手機領域的第一槍。隔年,麒麟 980 芯片問世,同樣以一年一個制程的速度演進。
2018 年 10 月,華為“達芬奇”架構浮出水面,首次發(fā)布華為全棧全場景 AI 戰(zhàn)略及計劃,其中包括全球首個覆蓋全場景人工智能的華為 Ascend (昇騰)系列芯片以及基于該系列芯片的產(chǎn)品和云服務。最重磅的當屬昇騰 310 和昇騰 910 兩款 AI 芯片的發(fā)布。
圖 | 2018 華為 HC 全聯(lián)接大會上,華為推出首款全棧全場景人工智能芯片——Ascend 310(來源:華為)
昇騰 310 芯片鎖定邊緣計算,采用 12nm 工藝技術,在 8W 的功耗上實現(xiàn)了 8 TOPS 半精度浮點數(shù)算力或 16 TOPS 8 位整數(shù)算力,且集成了單通道全高清視頻解碼器。
昇騰 310 芯片強調(diào)全高清視頻解碼器,因此初期應用場景應會是以這一波人工智能最熱門的機器視覺為主。
再往上發(fā)展至云端計算領域,尤其是云端的訓練芯片昇騰 910,具備核心技術實力,與 Google、NVIDIA 兩大巨頭正面對弈是可以預期的。
透視華為的昇騰芯片,雖然看起來只是一顆小小的芯片,但其實是一個微型系統(tǒng),其內(nèi)部集成了 AI 核、鯤鵬內(nèi)核,及編解碼芯片等其他功能獨立的部件,通過這些內(nèi)部部件對外提供通用的 AI 算力,可以應用在不同的場景。其中,達芬奇架構扮演的角色就是自研的 AI 加速器,和傳統(tǒng)的 ARM 核心架構進行協(xié)調(diào)來加速 AI 計算效能,再把計算用的乘加器(MAC)按照不同的計算組織成不同的方式,并搭配標準的數(shù)據(jù)緩存。
這和以 NVIDIA 的 GPU 架構作為 AI 加速器來優(yōu)化智能計算是一樣的邏輯。其 GPU 為了優(yōu)化人工智能的計算功能,加入了對于矩陣運算的優(yōu)化支持的 Tensor Core,但畢竟 GPU 不是天生為 AI 計算所設計,計算效率不高,因此才會引得這么多企業(yè)都紛紛競逐 AI 戰(zhàn)場自研芯片,與 NVIDIA 的 GPU 同臺競爭。
華為自研的達芬奇架構就是一例,且達芬奇架構就是為 AI 而生,終極目標是人工智能走進千家萬戶。
若是再與 Google 的 TPU 相比,達芬奇架構更為簡潔。因為 TPU 使用了脈動陣列(systolic array)架構,優(yōu)勢是對于內(nèi)存帶寬的需求減少,但問題在于一旦到了終端的低算力和低功耗應用中,效率問題會浮現(xiàn)。
根據(jù)華為規(guī)劃,基于達芬奇架構的昇騰芯片分為 Max、Mini、Lite、Tiny、Nano 五個系列,除了昇騰 910(Max)、昇騰310(Mini)之外,另外三個系列 Lite、Tiny、Nano 分別是瞄準物聯(lián)網(wǎng)、智能手機、智能穿戴等終端場景,以 IP 和芯片搭載的方式嵌入于不同產(chǎn)品中。
華為 MindSpore 計算框架的普惠 AI 愿景
這其中的一個重點是同時支持云、邊緣、端各個場景獨立又協(xié)同的統(tǒng)一訓練和推理框架 MindSpore,是華為人工智能戰(zhàn)略中的一張王牌。
為什么要有機器學習算法框架?因為人工智能從學術理論研究,一直落實到應用層面,當中涉及很多步驟和工具,為了簡化過程,需要有個計算框架作為基礎的平臺和工具,也讓不同領域的專家如數(shù)學家、科學家、計算機專家等,可以更專注于自身領域的創(chuàng)新和技術,不然會很耗費人才。
圖 | 華為的全棧全場景 AI 解決方案(來源:華為)
在深度學習框架的世界中,如果說 Google 的 TensorFlow、Amazon 的 MXnet、Facebook 的 PyTorch,以及 Microsoft 的 CNTK 被列為當今四大門派,華為 MindSpore 是最強的挑戰(zhàn)者。
AI 計算框架對于降低 AI 的開發(fā)和使用門檻、釋放 AI 生產(chǎn)力、最大程度發(fā)揮 AI 芯片算力潛力等都是至關重要的。華為既是 AI 芯片及硬件解決方案提供商,同時由于本身的業(yè)務領域廣泛并已經(jīng)在終端、邊緣計算、云服務、網(wǎng)絡設備、5G 等都已經(jīng)部署 AI 能力,華為也是 AI 的深度使用者。
華為 MindSpore 作為基于其過去多年對AI技術的使用和探索經(jīng)驗研制的 AI 計算框架,勢必為 AI 產(chǎn)業(yè)界帶來驚喜,進一步升級 AI 計算框架,在云邊端所有場景全面發(fā)揮 AI 芯片算力潛能、降低 AI 門檻,MindSpore 無疑將是華為實現(xiàn)普惠 AI 抱負的重要一環(huán)。
打造易用平臺,累積 AI 人才
同時,在進入人工智能時代后,開發(fā)者已經(jīng)成為與行業(yè)合作伙伴同等重要的角色,華為是否能通過 MindSpore 計算框架來打造有利的生態(tài)發(fā)展條件,進而吸引足夠的開發(fā)者來使用華為的技術方案,是其實施全棧全場景 AI 戰(zhàn)略的下一階段關鍵。
阿里巴巴創(chuàng)始人馬云曾說,中國在人工智能方面的人才極端缺乏,幾乎沒什么人才。另一維度,根據(jù)騰訊研究院發(fā)布的《中美兩國人工智能產(chǎn)業(yè)發(fā)展全面解讀》分析,美國人工智能產(chǎn)業(yè)總量約是中國的兩倍。
要解開人才短缺的問題,提出簡單易學的人工智能平臺、工具和算法框架是最基本的。再者,通過提供培訓,借助于平臺在開發(fā)者群體中的口碑效應,可以吸引更多人才投入。同時,也能建立企業(yè)在該領域的影響力,可以累積有價值的 AI 人才,這些都將推動人工智能生態(tài)的正循環(huán)。
華為的達芬奇架構問世,對于國內(nèi)人工智能領域是一個重大里程碑,這也是系統(tǒng)廠商自研芯片策略的終極展示。
過往,系統(tǒng)廠的芯片需求幾乎都被英特爾的標準型通用芯片一統(tǒng)天下,隨著品牌系統(tǒng)廠商為了凸顯產(chǎn)品的差異性和簡化硬件架構,開始走向自研專用芯片,蘋果自研手機處理器芯片做了一個巨大的帶頭示范。
在進入人工智能時代后,由于應用場景的多樣化和復雜度,自研芯片的能力代表著技術競爭力的門檻能堆砌多高。因此,這場人工智能戰(zhàn)役基本上不會有大型系統(tǒng)廠缺席,同時,華為這種掌握硬核科技實力、擁有普惠 AI 抱負的系統(tǒng)大廠,基于其 AI 戰(zhàn)略的真正投入和實施,我們相信將對整個 AI 產(chǎn)業(yè)帶來極為積極的正面影響。
-
Google
+關注
關注
5文章
1789瀏覽量
59031 -
NVIDIA
+關注
關注
14文章
5309瀏覽量
106404 -
AI
+關注
關注
88文章
35147瀏覽量
279833
發(fā)布評論請先 登錄
高性能計算集群在AI領域的應用前景

百度在AI領域的最新進展
華為在MWC 2025舉辦移動AI產(chǎn)業(yè)峰會
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......
AI賦能邊緣網(wǎng)關:開啟智能時代的新藍海
FPGA在AI方面有哪些應用
AI編程在工業(yè)自動化設備上應用趨勢
AI 在串口屏應用領域的發(fā)展前景
光耦知識分享|探討光耦技術在人工智能(AI)領域的應用

評論