chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI芯片到底是什么

454398 ? 來源:ST社區(qū) ? 作者:ST社區(qū) ? 2022-11-28 11:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:ST社區(qū)

2010年以來,由于大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,數(shù)據(jù)量呈現(xiàn)爆炸性增長態(tài)勢,而傳統(tǒng)的計(jì)算架構(gòu)又無法支撐深度學(xué)習(xí)的大規(guī)模并行計(jì)算需求,于是研究界對AI芯片進(jìn)行了新一輪的技術(shù)研發(fā)與應(yīng)用研究。這一新興技術(shù)既為科技巨頭的業(yè)務(wù)升級和拓展帶來轉(zhuǎn)機(jī),也給了新創(chuàng)企業(yè)顛覆現(xiàn)有格局的機(jī)會。

AI芯片是人工智能時代的技術(shù)核心之一,決定了平臺的基礎(chǔ)架構(gòu)和發(fā)展生態(tài)。作為人工智能產(chǎn)業(yè)的重中之重,AI芯片已經(jīng)成了最熱門的投資領(lǐng)域,各種AI芯片層出不窮。

從廣義上講,只要能夠運(yùn)行人工智能算法的芯片都叫作AI芯片。但是通常意義上的AI芯片指的是針對人工智能算法做了特殊加速設(shè)計(jì)的芯片,現(xiàn)階段,這些人工智能算法一般以深度學(xué)習(xí)算法為主,也可以包括其它機(jī)器學(xué)習(xí)算法。

一般來說,所謂的AI芯片,是指針對AI算法的ASIC(專用芯片)。傳統(tǒng)的CPU、GPU都可以拿來執(zhí)行AI算法,但是速度慢,性能低,無法實(shí)際商用。

比如,自動駕駛需要識別道路行人紅綠燈等狀況,但是如果是當(dāng)前的CPU去算,那么估計(jì)車翻到河里了還沒發(fā)現(xiàn)前方是河,這是速度慢,時間就是生命。如果用GPU,的確速度要快得多,但是,功耗大,汽車的電池估計(jì)無法長時間支撐正常使用,而且, GPU巨貴,普通消費(fèi)者也用不起。另外,GPU因?yàn)椴皇菍iT針對AI算法開發(fā)的ASIC,所以,說到底,速度還沒到極限,還有提升空間。而類似智能駕駛這樣的領(lǐng)域,必須快!在手機(jī)終端,可以自行人臉識別、語音識別等AI應(yīng)用,這個又必須功耗低。

AI芯片到底是什么?

回答這個問題之前,先來弄明白兩個概念,什么是CPU和GPU?

簡單來說,CPU就是手機(jī)的“大腦”,也是手機(jī)正常運(yùn)行的“總指揮官”。GPU被翻譯成圖形處理器,主要工作確實(shí)是圖像處理。

再來說說CPU和GPU之間的分工,CPU遵循的是馮諾依曼架構(gòu),核心就是“存儲程序,順序執(zhí)行”,就像是做事一板一眼的管家,什么事情都要一步一步來。假如你讓CPU去種一棵樹,挖坑、澆水、植樹、封土等工作都要獨(dú)自一步一步進(jìn)行。

如果讓GPU去種一棵樹的話,會喊來小A、小B、小C等一同來完成,把挖坑、澆水、植樹、封土等工作分割成不同的子任務(wù)。這是因?yàn)镚PU執(zhí)行的是并行運(yùn)算,即把一個問題分解成若干個部分,各部分由獨(dú)立的計(jì)算單元去完成。恰好圖像處理的每一個像素點(diǎn)都需要被計(jì)算,與GPU的工作原理不謀而合。

就如同比方:CPU像是老教授,積分、微分什么都會算,但有些工作是計(jì)算大量一百以內(nèi)的加減乘除,最好的方法當(dāng)然不是讓老教授挨個算下去,而是雇上幾十個小學(xué)生把任務(wù)分配下去。這就是CPU和GPU的分工,CPU負(fù)責(zé)大型運(yùn)算,GPU為圖像處理而生,從電腦智能手機(jī)都是如此。

但當(dāng)人工智能的需求出現(xiàn)后,CPU和GPU的分工就出現(xiàn)了問題,人工智能終端的深度學(xué)習(xí)和傳統(tǒng)計(jì)算不同,借由后臺預(yù)先從大量訓(xùn)練數(shù)據(jù)中總結(jié)出規(guī)律,得到可以給人工智能終端判定的參數(shù),比如訓(xùn)練樣本是人臉圖像數(shù)據(jù),實(shí)現(xiàn)的功能在終端上就是人臉識別。

CPU往往需要數(shù)百甚至上千條指令才能完成一個神經(jīng)元的處理,無法支撐起大規(guī)模的并行運(yùn)算,而手機(jī)上的GPU又需要處理各種應(yīng)用的圖像處理需求。強(qiáng)行使用CPU和GPU進(jìn)行人工智能任務(wù),結(jié)果普遍是效率低下、發(fā)熱嚴(yán)重。

諸如蘋果A12、麒麟980和Exynos 9820提供的AI芯片的一種。通俗來說就是人工智能加速器,因?yàn)镚PU是基于塊數(shù)據(jù)處理的,但手機(jī)上的AI應(yīng)用是需要實(shí)時處理的,人工智能加速器剛好解決了這個痛點(diǎn),把深度學(xué)習(xí)相關(guān)的工作接管過來,從而緩解CPU 和GPU 的壓力。

它們將CPU和GPU的計(jì)算量分開,諸如面部識別、語音識別等AI相關(guān)的任務(wù)卸載到ASIC上處理,AI芯片核早已成為一種行業(yè)趨勢。

一方面AI芯片的價(jià)值在于與CPU、GPU進(jìn)行協(xié)同分工,CPU和GPU過多的任務(wù)堆疊只會虛耗電量、提高溫度。

另一方面在AI芯片的協(xié)同下,可以對用戶行為進(jìn)行學(xué)習(xí),進(jìn)而對用戶的使用場景進(jìn)行預(yù)測,然后進(jìn)行合理的性能分配。好比說當(dāng)你在游戲時讓CPU高效運(yùn)算,而當(dāng)你在看電子書時避免性能浪費(fèi)。

AI芯片發(fā)展歷程

從圖靈的論文《計(jì)算機(jī)器與智能》和圖靈測試,到最初級的神經(jīng)元模擬單元——感知機(jī),再到現(xiàn)在多達(dá)上百層的深度神經(jīng)網(wǎng)絡(luò),人類對人工智能的探索從來就沒有停止過。上世紀(jì)八十年代,多層神經(jīng)網(wǎng)絡(luò)和反向傳播算法的出現(xiàn)給人工智能行業(yè)點(diǎn)燃了新的火花。反向傳播的主要創(chuàng)新在于能將信息輸出和目標(biāo)輸出之間的誤差通過多層網(wǎng)絡(luò)往前一級迭代反饋,將最終的輸出收斂到某一個目標(biāo)范圍之內(nèi)。1989年貝爾實(shí)驗(yàn)室成功利用反向傳播算法,在多層神經(jīng)網(wǎng)絡(luò)開發(fā)了一個手寫郵編識別器。1998年Yann LeCun和Yoshua Bengio發(fā)表了手寫識別神經(jīng)網(wǎng)絡(luò)和反向傳播優(yōu)化相關(guān)的論文《Gradient-based learning applied to document recognition》,開創(chuàng)了卷積神經(jīng)網(wǎng)絡(luò)的時代。

此后,人工智能陷入了長時間的發(fā)展沉寂階段,直到1997年IBM的深藍(lán)戰(zhàn)勝國際象棋大師和2011年IBM的沃森智能系統(tǒng)在Jeopardy節(jié)目中勝出,人工智能才又一次為人們所關(guān)注。2016年Alpha Go擊敗韓國圍棋九段職業(yè)選手,則標(biāo)志著人工智能的又一波高潮。從基礎(chǔ)算法、底層硬件、工具框架到實(shí)際應(yīng)用場景,現(xiàn)階段的人工智能領(lǐng)域已經(jīng)全面開花。

作為人工智能核心的底層硬件AI芯片,也同樣經(jīng)歷了多次的起伏和波折,總體看來,AI芯片的發(fā)展前后經(jīng)歷了四次大的變化。

1、2007年以前,AI芯片產(chǎn)業(yè)一直沒有發(fā)展成為成熟的產(chǎn)業(yè);同時由于當(dāng)時算法、數(shù)據(jù)量等因素,這個階段AI芯片并沒有特別強(qiáng)烈的市場需求,通用的CPU芯片即可滿足應(yīng)用需要。

2、隨著高清視頻、VR、AR游戲等行業(yè)的發(fā)展,GPU產(chǎn)品取得快速的突破;同時人們發(fā)現(xiàn)GPU的并行計(jì)算特性恰好適應(yīng)人工智能算法及大數(shù)據(jù)并行計(jì)算的需求,如GPU比之前傳統(tǒng)的CPU在深度學(xué)習(xí)算法的運(yùn)算上可以提高幾十倍的效率,因此開始嘗試使用GPU進(jìn)行人工智能計(jì)算。

3、進(jìn)入2010年后,云計(jì)算廣泛推廣,人工智能的研究人員可以通過云計(jì)算借助大量CPU和GPU進(jìn)行混合運(yùn)算,進(jìn)一步推進(jìn)了AI芯片的深入應(yīng)用,從而催生了各類AI芯片的研發(fā)與應(yīng)用。

4、人工智能對于計(jì)算能力的要求不斷快速地提升,進(jìn)入2015年后,GPU性能功耗比不高的特點(diǎn)使其在工作適用場合受到多種限制,業(yè)界開始研發(fā)針對人工智能的專用芯片,以期通過更好的硬件和芯片架構(gòu),在計(jì)算效率、能耗比等性能上得到進(jìn)一步提升。

AI芯片與普通芯片的區(qū)別在哪里?

AI算法,在圖像識別等領(lǐng)域,常用的是CNN卷積網(wǎng)絡(luò),語音識別、自然語言處理等領(lǐng)域,主要是RNN,這是兩類有區(qū)別的算法。但是,他們本質(zhì)上,都是矩陣或vector的乘法、加法,然后配合一些除法、指數(shù)等算法。

一個成熟的AI算法,比如YOLO-V3,就是大量的卷積、殘差網(wǎng)絡(luò)、全連接等類型的計(jì)算,本質(zhì)是乘法和加法。對于YOLO-V3來說,如果確定了具體的輸入圖形尺寸,那么總的乘法加法計(jì)算次數(shù)是確定的。比如一萬億次。(真實(shí)的情況比這個大得多的多)那么要快速執(zhí)行一次YOLO-V3,就必須執(zhí)行完一萬億次的加法乘法次數(shù)。

這個時候就來看了,比如IBM的POWER8,最先進(jìn)的服務(wù)器用超標(biāo)量CPU之一,4GHz,SIMD,128bit,假設(shè)是處理16bit的數(shù)據(jù),那就是8個數(shù),那么一個周期,最多執(zhí)行8個乘加計(jì)算。一次最多執(zhí)行16個操作。這還是理論上,其實(shí)是不大可能的。那么CPU一秒鐘的巔峰計(jì)算次數(shù)=16X4Gops=64Gops。這樣,可以算算CPU計(jì)算一次的時間了。同樣的,換成GPU算算,也能知道執(zhí)行時間。

再來說說AI芯片。比如大名鼎鼎的谷歌的TPU1。

TPU1,大約700M Hz,有256X256尺寸的脈動陣列,一共256X256=64K個乘加單元,每個單元一次可執(zhí)行一個乘法和一個加法。那就是128K個操作。(乘法算一個,加法再算一個)

另外,除了脈動陣列,還有其他模塊,比如激活等,這些里面也有乘法、加法等。所以,看看TPU1一秒鐘的巔峰計(jì)算次數(shù)至少是=128K X 700MHz=89600Gops=大約90Tops。對比一下CPU與TPU1,會發(fā)現(xiàn)計(jì)算能力有幾個數(shù)量級的差距,這就是為啥說CPU慢。

當(dāng)然,以上的數(shù)據(jù)都是完全最理想的理論值,實(shí)際情況,能夠達(dá)到5%吧。因?yàn)?,芯片上的存儲不夠大,所以?shù)據(jù)會存儲在DRAM中,從DRAM取數(shù)據(jù)很慢的,所以,乘法邏輯往往要等待。另外,AI算法有許多層網(wǎng)絡(luò)組成,必須一層一層的算,所以,在切換層的時候,乘法邏輯又是休息的,所以,諸多因素造成了實(shí)際的芯片并不能達(dá)到利潤的計(jì)算峰值,而且差距還極大。

目前來看,神經(jīng)網(wǎng)絡(luò)的尺寸是越來越大,參數(shù)越來越多,遇到大型NN模型,訓(xùn)練需要花幾周甚至一兩個月的時候。突然斷電,還得一切重來。修改了模型,需要幾個星期才能知道對錯,確定等得起?突然有了TPU,然后你發(fā)現(xiàn),吃個午飯回來就好了,參數(shù)優(yōu)化一下,繼續(xù)跑,多么爽!

總的來說,CPU與GPU并不是AI專用芯片,為了實(shí)現(xiàn)其他功能,內(nèi)部有大量其他邏輯,而這些邏輯對于目前的AI算法來說是完全用不上的,所以,自然造成CPU與GPU并不能達(dá)到最優(yōu)的性價(jià)比。

目前在圖像識別、語音識別、自然語言處理等領(lǐng)域,精度最高的算法就是基于深度學(xué)習(xí)的,傳統(tǒng)的機(jī)器學(xué)習(xí)的計(jì)算精度已經(jīng)被超越,目前應(yīng)用最廣的算法,估計(jì)非深度學(xué)習(xí)莫屬,而且,傳統(tǒng)機(jī)器學(xué)習(xí)的計(jì)算量與深度學(xué)習(xí)比起來少很多,所以,討論AI芯片時就針對計(jì)算量特別大的深度學(xué)習(xí)而言。畢竟,計(jì)算量小的算法,說實(shí)話,CPU已經(jīng)很快了。而且,CPU適合執(zhí)行調(diào)度復(fù)雜的算法,這一點(diǎn)是GPU與AI芯片都做不到的,所以他們?nèi)咧皇轻槍Σ煌膽?yīng)用場景而已,都有各自的主場。

AI芯片的分類及技術(shù)

人工智能芯片目前有兩種發(fā)展路徑:一種是延續(xù)傳統(tǒng)計(jì)算架構(gòu),加速硬件計(jì)算能力,主要以3種類型的芯片為代表,即GPU、FPGA、ASIC,但CPU依舊發(fā)揮著不可替代的作用;另一種是顛覆經(jīng)典的馮·諾依曼計(jì)算架構(gòu),采用類腦神經(jīng)結(jié)構(gòu)來提升計(jì)算能力,以IBM TrueNorth芯片為代表。

傳統(tǒng)的CPU

計(jì)算機(jī)工業(yè)從1960年代早期開始使用CPU這個術(shù)語。迄今為止,CPU從形態(tài)、設(shè)計(jì)到實(shí)現(xiàn)都已發(fā)生了巨大的變化,但是其基本工作原理卻一直沒有大的改變。通常CPU由控制器和運(yùn)算器這兩個主要部件組成。傳統(tǒng)的CPU內(nèi)部結(jié)構(gòu)中,實(shí)質(zhì)上僅單獨(dú)的ALU模塊(邏輯運(yùn)算單元)是用來完成數(shù)據(jù)計(jì)算的,其他各個模塊的存在都是為了保證指令能夠一條接一條的有序執(zhí)行。這種通用性結(jié)構(gòu)對于傳統(tǒng)的編程計(jì)算模式非常適合,同時可以通過提升CPU主頻(提升單位時間內(nèi)執(zhí)行指令的條數(shù))來提升計(jì)算速度。但對于深度學(xué)習(xí)中的并不需要太多的程序指令、卻需要海量數(shù)據(jù)運(yùn)算的計(jì)算需求,這種結(jié)構(gòu)就顯得有些力不從心。尤其是在功耗限制下,無法通過無限制的提升CPU和內(nèi)存的工作頻率來加快指令執(zhí)行速度,這種情況導(dǎo)致CPU系統(tǒng)的發(fā)展遇到不可逾越的瓶頸。

并行加速計(jì)算的GPU

GPU作為最早從事并行加速計(jì)算的處理器,相比CPU速度快,同時比其他加速器芯片編程靈活簡單。

傳統(tǒng)的CPU之所以不適合人工智能算法的執(zhí)行,主要原因在于其計(jì)算指令遵循串行執(zhí)行的方式,沒能發(fā)揮出芯片的全部潛力。與之不同的是,GPU具有高并行結(jié)構(gòu),在處理圖形數(shù)據(jù)和復(fù)雜算法方面擁有比CPU更高的效率。對比GPU和CPU在結(jié)構(gòu)上的差異,CPU大部分面積為控制器和寄存器,而GPU擁有更ALU(ARITHMETIC LOGIC UNIT,邏輯運(yùn)算單元)用于數(shù)據(jù)處理,這樣的結(jié)構(gòu)適合對密集型數(shù)據(jù)進(jìn)行并行處理。程序在GPU系統(tǒng)上的運(yùn)行速度相較于單核CPU往往提升幾十倍乃至上千倍。隨著英偉達(dá)、AMD等公司不斷推進(jìn)其對GPU大規(guī)模并行架構(gòu)的支持,面向通用計(jì)算的GPU(即GPGPU,GENERAL PURPOSE GPU,通用計(jì)算圖形處理器)已成為加速可并行應(yīng)用程序的重要手段。

目前,GPU已經(jīng)發(fā)展到較為成熟的階段。谷歌、FACEBOOK、微軟、TWITTER和百度等公司都在使用GPU分析圖片、視頻和音頻文件,以改進(jìn)搜索和圖像標(biāo)簽等應(yīng)用功能。此外,很多汽車生產(chǎn)商也在使用GPU芯片發(fā)展無人駕駛。不僅如此,GPU也被應(yīng)用于VR/AR相關(guān)的產(chǎn)業(yè)。但是GPU也有一定的局限性。深度學(xué)習(xí)算法分為訓(xùn)練和推斷兩部分,GPU平臺在算法訓(xùn)練上非常高效。但在推斷中對于單項(xiàng)輸入進(jìn)行處理的時候,并行計(jì)算的優(yōu)勢不能完全發(fā)揮出來。

半定制化的FPGA

FPGA是在PAL、GAL、CPLD等可編程器件基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。用戶可以通過燒入FPGA配置文件來定義這些門電路以及存儲器之間的連線。這種燒入不是一次性的,比如用戶可以把FPGA配置成一個微控制器MCU,使用完畢后可以編輯配置文件把同一個FPGA配置成一個音頻編解碼器。因此,它既解決了定制電路靈活性的不足,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn)。

FPGA可同時進(jìn)行數(shù)據(jù)并行和任務(wù)并行計(jì)算,在處理特定應(yīng)用時有更加明顯的效率提升。對于某個特定運(yùn)算,通用CPU可能需要多個時鐘周期;而FPGA可以通過編程重組電路,直接生成專用電路,僅消耗少量甚至一次時鐘周期就可完成運(yùn)算。

此外,由于FPGA的靈活性,很多使用通用處理器或ASIC難以實(shí)現(xiàn)的底層硬件控制操作技術(shù),利用FPGA可以很方便的實(shí)現(xiàn)。這個特性為算法的功能實(shí)現(xiàn)和優(yōu)化留出了更大空間。同時FPGA一次性成本(光刻掩模制作成本)遠(yuǎn)低于ASIC,在芯片需求還未成規(guī)模、深度學(xué)習(xí)算法暫未穩(wěn)定,需要不斷迭代改進(jìn)的情況下,利用FPGA芯片具備可重構(gòu)的特性來實(shí)現(xiàn)半定制的人工智能芯片是最佳選擇之一。

功耗方面,從體系結(jié)構(gòu)而言,F(xiàn)PGA也具有天生的優(yōu)勢。傳統(tǒng)的馮氏結(jié)構(gòu)中,執(zhí)行單元(如CPU核)執(zhí)行任意指令,都需要有指令存儲器、譯碼器、各種指令的運(yùn)算器及分支跳轉(zhuǎn)處理邏輯參與運(yùn)行,而FPGA每個邏輯單元的功能在重編程(即燒入)時就已經(jīng)確定,不需要指令,無需共享內(nèi)存,從而可以極大的降低單位執(zhí)行的功耗,提高整體的能耗比。

由于FPGA具備靈活快速的特點(diǎn),因此在眾多領(lǐng)域都有替代ASIC的趨勢。

全定制化的ASIC

目前以深度學(xué)習(xí)為代表的人工智能計(jì)算需求,主要采用GPU、FPGA等已有的適合并行計(jì)算的通用芯片來實(shí)現(xiàn)加速。在產(chǎn)業(yè)應(yīng)用沒有大規(guī)模興起之時,使用這類已有的通用芯片可以避免專門研發(fā)定制芯片(ASIC)的高投入和高風(fēng)險(xiǎn)。但是,由于這類通用芯片設(shè)計(jì)初衷并非專門針對深度學(xué)習(xí),因而天然存在性能、功耗等方面的局限性。隨著人工智能應(yīng)用規(guī)模的擴(kuò)大,這類問題日益突顯。

GPU作為圖像處理器,設(shè)計(jì)初衷是為了應(yīng)對圖像處理中的大規(guī)模并行計(jì)算。因此,在應(yīng)用于深度學(xué)習(xí)算法時,有三個方面的局限性:第一,應(yīng)用過程中無法充分發(fā)揮并行計(jì)算優(yōu)勢。深度學(xué)習(xí)包含訓(xùn)練和推斷兩個計(jì)算環(huán)節(jié),GPU在深度學(xué)習(xí)算法訓(xùn)練上非常高效,但對于單一輸入進(jìn)行推斷的場合,并行度的優(yōu)勢不能完全發(fā)揮。第二,無法靈活配置硬件結(jié)構(gòu)。GPU采用SIMT計(jì)算模式,硬件結(jié)構(gòu)相對固定。目前深度學(xué)習(xí)算法還未完全穩(wěn)定,若深度學(xué)習(xí)算法發(fā)生大的變化,GPU無法像FPGA一樣可以靈活的配制硬件結(jié)構(gòu)。第三,運(yùn)行深度學(xué)習(xí)算法能效低于FPGA。

盡管FPGA倍受看好,甚至新一代百度大腦也是基于FPGA平臺研發(fā),但其畢竟不是專門為了適用深度學(xué)習(xí)算法而研發(fā),實(shí)際應(yīng)用中也存在諸多局限:第一,基本單元的計(jì)算能力有限。為了實(shí)現(xiàn)可重構(gòu)特性,F(xiàn)PGA內(nèi)部有大量極細(xì)粒度的基本單元,但是每個單元的計(jì)算能力(主要依靠LUT查找表)都遠(yuǎn)遠(yuǎn)低于CPU和GPU中的ALU模塊;第二、計(jì)算資源占比相對較低。為實(shí)現(xiàn)可重構(gòu)特性,F(xiàn)PGA內(nèi)部大量資源被用于可配置的片上路由與連線;第三,速度和功耗相對專用定制芯片(ASIC)仍然存在不小差距;第四,F(xiàn)PGA價(jià)格較為昂貴,在規(guī)模放量的情況下單塊FPGA的成本要遠(yuǎn)高于專用定制芯片。

深度學(xué)習(xí)算法穩(wěn)定后,AI芯片可采用ASIC設(shè)計(jì)方法進(jìn)行全定制,使性能、功耗和面積等指標(biāo)面向深度學(xué)習(xí)算法做到最優(yōu)。

類腦芯片

類腦芯片不采用經(jīng)典的馮·諾依曼架構(gòu),而是基于神經(jīng)形態(tài)架構(gòu)設(shè)計(jì),以IBM Truenorth為代表。IBM研究人員將存儲單元作為突觸、計(jì)算單元作為神經(jīng)元、傳輸單元作為軸突搭建了神經(jīng)芯片的原型。目前,Truenorth用三星28nm功耗工藝技術(shù),由54億個晶體管組成的芯片構(gòu)成的片上網(wǎng)絡(luò)有4096個神經(jīng)突觸核心,實(shí)時作業(yè)功耗僅為70mW。由于神經(jīng)突觸要求權(quán)重可變且要有記憶功能,IBM采用與CMOS工藝兼容的相變非揮發(fā)存儲器(PCM)的技術(shù)實(shí)驗(yàn)性的實(shí)現(xiàn)了新型突觸,加快了商業(yè)化進(jìn)程。

AI芯片應(yīng)用領(lǐng)域

隨著人工智能芯片的持續(xù)發(fā)展,應(yīng)用領(lǐng)域會隨時間推移而不斷向多維方向發(fā)展。

智能手機(jī)

2017年9月,華為在德國柏林消費(fèi)電子展發(fā)布了麒麟970芯片,該芯片搭載了寒武紀(jì)的NPU,成為“全球首款智能手機(jī)移動端AI芯片”;2017年10月中旬Mate10系列新品(該系列手機(jī)的處理器為麒麟970)上市。搭載了NPU的華為Mate10系列智能手機(jī)具備了較強(qiáng)的深度學(xué)習(xí)、本地端推斷能力,讓各類基于深度神經(jīng)網(wǎng)絡(luò)的攝影、圖像處理應(yīng)用能夠?yàn)橛脩籼峁└油昝赖捏w驗(yàn)。

而蘋果發(fā)布以iPhone X為代表的手機(jī)及它們內(nèi)置的A11 Bionic芯片。A11 Bionic中自主研發(fā)的雙核架構(gòu)Neural Engine(神經(jīng)網(wǎng)絡(luò)處理引擎),它每秒處理相應(yīng)神經(jīng)網(wǎng)絡(luò)計(jì)算需求的次數(shù)可達(dá)6000億次。這個Neural Engine的出現(xiàn),讓A11 Bionic成為一塊真正的AI芯片。A11 Bionic大大提升了iPhone X在拍照方面的使用體驗(yàn),并提供了一些富有創(chuàng)意的新用法。

ADAS(高級輔助駕駛系統(tǒng))

ADAS是最吸引大眾眼球的人工智能應(yīng)用之一,它需要處理海量的由激光雷達(dá)、毫米波雷達(dá)、攝像頭等傳感器采集的實(shí)時數(shù)據(jù)。相對于傳統(tǒng)的車輛控制方法,智能控制方法主要體現(xiàn)在對控制對象模型的運(yùn)用和綜合信息學(xué)習(xí)運(yùn)用上,包括神經(jīng)網(wǎng)絡(luò)控制和深度學(xué)習(xí)方法等。

CV(計(jì)算機(jī)視覺(Computer Vision)設(shè)備

需要使用計(jì)算機(jī)視覺技術(shù)的設(shè)備,如智能攝像頭、無人機(jī)、行車記錄儀、人臉識別迎賓機(jī)器人以及智能手寫板等設(shè)備,往往都具有本地端推斷的需要,如果僅能在聯(lián)網(wǎng)下工作,無疑將帶來糟糕的體驗(yàn)。而計(jì)算機(jī)視覺技術(shù)目前看來將會成為人工智能應(yīng)用的沃土之一,計(jì)算機(jī)視覺芯片將擁有廣闊的市場前景。

VR設(shè)備

VR設(shè)備芯片的代表為HPU芯片,是微軟為自身VR設(shè)備Hololens研發(fā)定制的。這顆由臺積電代工的芯片能同時處理來自5個攝像頭、1個深度傳感器以及運(yùn)動傳感器的數(shù)據(jù),并具備計(jì)算機(jī)視覺的矩陣運(yùn)算和CNN運(yùn)算的加速功能。這使得VR設(shè)備可重建高質(zhì)量的人像3D影像,并實(shí)時傳送到任何地方。

語音交互設(shè)備

語音交互設(shè)備芯片方面,國內(nèi)有啟英泰倫以及云知聲兩家公司,其提供的芯片方案均內(nèi)置了為語音識別而優(yōu)化的深度神經(jīng)網(wǎng)絡(luò)加速方案,實(shí)現(xiàn)設(shè)備的語音離線識別。穩(wěn)定的識別能力為語音技術(shù)的落地提供了可能;與此同時,語音交互的核心環(huán)節(jié)也取得重大突破。語音識別環(huán)節(jié)突破了單點(diǎn)能力,從遠(yuǎn)場識別,到語音分析和語義理解有了重大突破,呈現(xiàn)出一種整體的交互方案。

機(jī)器人

無論是家居機(jī)器人還是商用服務(wù)機(jī)器人均需要專用軟件+芯片的人工智能解決方案,這方面典型公司有由前百度深度學(xué)習(xí)實(shí)驗(yàn)室負(fù)責(zé)人余凱創(chuàng)辦的地平線機(jī)器人,當(dāng)然地平線機(jī)器人除此之外,還提供ADAS、智能家居等其他嵌入式人工智能解決方案。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54045

    瀏覽量

    466556
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39966

    瀏覽量

    301601
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    MOS管到底是什么?和三極管、繼電器有什么本質(zhì)區(qū)別?

    MOS管到底是什么?和三極管、繼電器有什么本質(zhì)區(qū)別?在電子設(shè)備的“心臟”部位,藏著許多默默工作的“開關(guān)選手”。它們操控著電流的通斷,決定著設(shè)備的效率與穩(wěn)定性。其中,MOS管作為近年來高頻
    的頭像 發(fā)表于 01-07 13:46 ?588次閱讀
    MOS管<b class='flag-5'>到底是</b>什么?和三極管、繼電器有什么本質(zhì)區(qū)別?

    請問Keil中的map文件到底是什么意思?

    Keil中的map文件到底是什么意思?里面是如何進(jìn)行相關(guān)執(zhí)行操作的
    發(fā)表于 11-25 06:59

    單片機(jī)和嵌入式,到底是什么關(guān)系?

    的關(guān)系:什么是單片機(jī)?什么是嵌入式?它們到底是不是一回事?先說說大家最先聽說的那個詞——單片機(jī)(MCU)。單片機(jī),全稱是MicrocontrollerUnit,顧名思
    的頭像 發(fā)表于 11-14 10:28 ?1590次閱讀
    單片機(jī)和嵌入式,<b class='flag-5'>到底是</b>什么關(guān)系?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    、分布式群體智能 1)物聯(lián)網(wǎng)AGI系統(tǒng) 優(yōu)勢: 組成部分: 2)分布式AI訓(xùn)練 7、發(fā)展重點(diǎn):基于強(qiáng)化學(xué)習(xí)的后訓(xùn)練與推理 8、超越大模型:神經(jīng)符號計(jì)算 三、AGI芯片的實(shí)現(xiàn) 1、技術(shù)需求 AI取得成功
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    流體芯片AI計(jì)算平臺 ⑥基于AI的自主決策系統(tǒng) ⑦基于AI的自主學(xué)習(xí)系統(tǒng) 2、面臨的挑戰(zhàn) ①需要造就一個跨學(xué)科、全面性覆蓋的知識庫和科學(xué)基礎(chǔ)模型 ②需要解決信息不準(zhǔn)確和認(rèn)知偏差問題
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺濕潤的軟組織
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    AI芯片:科技探索與AGI愿景》這本書是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術(shù)與創(chuàng)新未來》一書是姊妹篇,由此可見作者在AI
    發(fā)表于 09-05 15:10

    IEC 到底是什么?為什么它能影響全球?

    IEC 到底是什么?為什么它能影響全球?
    的頭像 發(fā)表于 09-04 17:07 ?3632次閱讀

    AI 芯片浪潮下,職場晉升新契機(jī)?

    在科技飛速發(fā)展的當(dāng)下,AI 芯片已然成為眾多行業(yè)變革的核心驅(qū)動力。從互聯(lián)網(wǎng)巨頭的數(shù)據(jù)中心,到我們?nèi)粘J褂玫闹悄苁謾C(jī)、智能家居設(shè)備,AI 芯片的身影無處不在,深刻改變著產(chǎn)品形態(tài)與服務(wù)模式
    發(fā)表于 08-19 08:58

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    名單公布 @LiuDW、@jinglixixi、@bruceleesohu 請于9月3日前,前往【書籍評測活動NO.64】《AI芯片:科技探索與AGI愿景》完成書籍兌換。 如有疑問請 添加小助手微信
    發(fā)表于 07-28 13:54

    晶振的 “負(fù)載電容” 到底是什么

    負(fù)載電容,到底是什么? 負(fù)載電容,簡單來說,是指晶振的兩條引線連接IC塊內(nèi)部及外部所有有效電容之和,我們可以將其看作晶振片在電路中串接的電容。從更專業(yè)的角度講,它是為了使晶振能夠在其標(biāo)稱頻率下穩(wěn)定
    的頭像 發(fā)表于 07-25 16:26 ?1094次閱讀

    請問編譯純r(jià)tos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?

    編譯純r(jià)tos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?
    發(fā)表于 07-11 07:22

    智能盒子到底是什么東西?昇騰310深度測評:為何能成為行業(yè)新寵?

    讓人摸不著頭腦的“智能盒子”。各位搞技術(shù)、搞工程的朋友,咱們在工作中是不是經(jīng)常聽到“智能盒子”這個說法?每次聽到這個詞,我猜很多人心里都在犯嘀咕:這東西到底是個啥玩意兒?難道就是個裝了點(diǎn)智能軟件的普通盒子?它到底有啥用?能給咱們的工作帶來啥方便?
    的頭像 發(fā)表于 04-27 10:46 ?1906次閱讀
    智能盒子<b class='flag-5'>到底是</b>什么東西?昇騰310深度測評:為何能成為行業(yè)新寵?

    一文給你講透!DA板卡到底是什么?它和主板又有哪些不同?

    大家好,我是老王,在電子行業(yè)干了十幾年,今天我就用“大白話”給大家講講DA板卡到底是啥,它和咱們常說的“主板”有啥區(qū)別。文章里會穿插一些表格和實(shí)際案例,保證你讀完不僅能懂,還能跟朋友吹牛!
    的頭像 發(fā)表于 04-24 16:48 ?2546次閱讀
    一文給你講透!DA板卡<b class='flag-5'>到底是</b>什么?它和主板又有哪些不同?