chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如今火熱的AI芯片到底是什么

拉拉 ? 來(lái)源:jf_35653895 ? 作者:jf_35653895 ? 2024-09-06 10:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

眾所周知,人工智能的三大基礎(chǔ)要素是數(shù)據(jù)、算法和算力,而這三大要素的核心就是AI芯片技術(shù)。隨著各項(xiàng)基于AIGC前沿科技的廣泛應(yīng)用,AI對(duì)于算力的要求開(kāi)始不斷地快速攀升。特別是深度學(xué)習(xí)成為當(dāng)前AI研究和運(yùn)用的主流方式,目前通用的CPU可以拿來(lái)執(zhí)行AI的算法。但是因?yàn)閮?nèi)部有大量的非運(yùn)算邏輯,而這些指令級(jí)對(duì)于目前的AI算法來(lái)說(shuō)是完全用不上的,所以CPU并不能達(dá)到最高的運(yùn)算效率。因此,具有海量并行計(jì)算能力并且能夠加速AI計(jì)算的AI芯片應(yīng)運(yùn)而生。

什么是AI芯片

從廣義上講,只要能夠進(jìn)行人工智能算法或者面向AI計(jì)算應(yīng)用的芯片都叫做AI芯片。但是,通常意義上的AI芯片指的是針對(duì)人工智能算法做了特殊加速設(shè)計(jì)的芯片。他們的目的就是為了更高效地執(zhí)行AI算法。

AI芯片的發(fā)展歷程

從圖靈的論文《計(jì)算機(jī)器與智能》和圖靈測(cè)試,到最初的神經(jīng)元模擬單元感知機(jī),再到現(xiàn)在多達(dá)上百層的深度神經(jīng)網(wǎng)絡(luò),人類對(duì)人工智能的探索從來(lái)都沒(méi)有停止過(guò)。上世紀(jì)80年代,多層神經(jīng)網(wǎng)絡(luò)和反向傳播算法的出現(xiàn)給人工智能行業(yè)點(diǎn)燃了新的火花。1989年,貝爾實(shí)驗(yàn)室成功利用了反向傳播算法在多層神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)了一個(gè)手寫郵編識(shí)別器。1998年,兩位人工智能科學(xué)家楊立坤和約書亞·本杰奧發(fā)表了手寫識(shí)別神經(jīng)網(wǎng)絡(luò)和反向傳播優(yōu)化相關(guān)的論文,開(kāi)創(chuàng)了卷積神經(jīng)網(wǎng)絡(luò)的時(shí)代。此后,人工智能陷入了長(zhǎng)時(shí)間的發(fā)展沉寂階段,直到1997年IBM的深藍(lán)戰(zhàn)勝了國(guó)際象棋大師,和2011年IBM的沃森智能系統(tǒng)在《危險(xiǎn)邊緣》節(jié)目中勝出,人工智能才又一次被人們所關(guān)注。2016年,阿爾法狗擊敗了韓國(guó)圍棋九段的職業(yè)選手,就標(biāo)志著人工智能的又一波高潮。從基礎(chǔ)算法、底層硬件和工具框架到實(shí)際的應(yīng)用場(chǎng)景,現(xiàn)階段的人工智能領(lǐng)域已經(jīng)全面開(kāi)花。作為人工智能核心的底層硬件,AI芯片同樣也經(jīng)歷了多次的起伏和波折??傮w來(lái)看,AI芯片的發(fā)展前后經(jīng)歷了四次大的變化。

2007年以前,AI芯片產(chǎn)業(yè)一直沒(méi)有發(fā)展成為成熟的產(chǎn)業(yè),同時(shí)由于當(dāng)時(shí)的算法、數(shù)據(jù)量等因素,這個(gè)階段的AI芯片并沒(méi)有特別強(qiáng)烈的市場(chǎng)需求,通用的CPU芯片即可滿足應(yīng)用需求。隨著高清視頻VR、AR、游戲等行業(yè)的發(fā)展,GPU產(chǎn)品得到了快速的突破,同時(shí)人們發(fā)現(xiàn)GPU的并行計(jì)算特性恰好適應(yīng)人工智能算法及大數(shù)據(jù)并行計(jì)算的需求。如GPU比之前傳統(tǒng)的CPU在深度學(xué)習(xí)算法的運(yùn)算上可以提升幾十倍的效率,因此開(kāi)始嘗試使用GPU進(jìn)行人工智能計(jì)算。進(jìn)入2010年后,云計(jì)算開(kāi)始廣泛推廣,人工智能的研究人員通過(guò)云計(jì)算借助大量的CPU和GPU進(jìn)行混合運(yùn)算,進(jìn)一步推進(jìn)了AI芯片的深入應(yīng)用,從而催生了各類AI芯片的研發(fā)和應(yīng)用。人工智能對(duì)于計(jì)算能力的要求在不斷地提升,進(jìn)入2015年后,GPU性能功耗比不高的特點(diǎn)使其在工作適用場(chǎng)合受到多種限制,業(yè)界開(kāi)始研發(fā)針對(duì)人工智能的專用芯片,以其通過(guò)更好的硬件和芯片架構(gòu)在計(jì)算效率、能耗比等性能上得到進(jìn)一步的提升。

AI芯片的分類

首先,從AI芯片的功能來(lái)看,AI實(shí)現(xiàn)包括兩個(gè)環(huán)節(jié):訓(xùn)練和推理。

所以根據(jù)承擔(dān)的任務(wù)不同,AI芯片可以分為基于構(gòu)建神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練芯片,和利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行推理預(yù)測(cè)的推理芯片。訓(xùn)練環(huán)節(jié)通常需要通過(guò)大量的數(shù)據(jù)輸入,訓(xùn)練出一個(gè)復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)模型。訓(xùn)練過(guò)程由于涉及海量的訓(xùn)練數(shù)據(jù)和復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),運(yùn)算量非常巨大,需要龐大的計(jì)算規(guī)模。對(duì)于處理器的計(jì)算能力、精度、可擴(kuò)展性的性能要求非常高。比如英偉達(dá)的H100,基于FP16的算力達(dá)到了2000TOPS,即每秒可以進(jìn)行2,000萬(wàn)億次的操作。而推理則是利用訓(xùn)練好的模型,使用新的數(shù)據(jù)去推理出各種結(jié)論。這個(gè)環(huán)節(jié)的計(jì)算量相對(duì)于訓(xùn)練環(huán)節(jié)就少很多,但是仍然會(huì)涉及到大量的矩陣運(yùn)算。比如英偉達(dá)的T4,基于INT8的算力為1,300TOPS。因此,訓(xùn)練芯片注重絕對(duì)的計(jì)算能力,而推理芯片更注重的是綜合指標(biāo),單位能耗、算力、延時(shí)等各項(xiàng)成本都需要考慮。

從AI芯片的應(yīng)用場(chǎng)景來(lái)看,也可以分為兩大類:服務(wù)器端和移動(dòng)端,也可以說(shuō)是云端和終端。

服務(wù)器端,從剛剛提到的訓(xùn)練階段,由于數(shù)據(jù)量和運(yùn)算量巨大,單一的處理器幾乎不可能獨(dú)立完成一個(gè)模型的訓(xùn)練過(guò)程,因此訓(xùn)練環(huán)節(jié)只能在云端實(shí)現(xiàn)。而推理階段,由于訓(xùn)練出來(lái)的深度神經(jīng)網(wǎng)絡(luò)模型仍然非常復(fù)雜,推理過(guò)程仍然屬于計(jì)算密集型和存儲(chǔ)密集型,同樣可以選擇部署在服務(wù)器端。移動(dòng)端,如手機(jī)智能家居、無(wú)人駕駛,移動(dòng)端AI芯片在設(shè)計(jì)思路上與服務(wù)器端的AI芯片有著本質(zhì)的區(qū)別。首先,它們對(duì)計(jì)算的能效要求非常之高;其次,在智能駕駛等實(shí)時(shí)性要求很高的場(chǎng)合,推理過(guò)程必須在設(shè)備本身完成,因此要求移動(dòng)設(shè)備具備足夠的推理能力。而某些場(chǎng)合還會(huì)有低功耗、低延遲、低成本的要求,從而要求移動(dòng)端的AI芯片更是多種多樣??偟膩?lái)說(shuō),服務(wù)器端AI芯片的特點(diǎn)是性能強(qiáng)大,并且能夠支持大量運(yùn)算;而移動(dòng)端的AI芯片特點(diǎn)是體積小、耗電少,并且有很快的計(jì)算效率。

最后,還可以從技術(shù)架構(gòu)來(lái)劃分,比如GPU、FPGA、ASIC和類腦芯片。

GPU:傳統(tǒng)的CPU之所以不適合人工智能算法的執(zhí)行,主要原因是在于計(jì)算指令遵循著串行執(zhí)行的,沒(méi)有辦法發(fā)揮出芯片的全部潛力。CPU大部分面積為控制器寄存器,而GPU擁有更多的邏輯運(yùn)算單元,用于數(shù)據(jù)處理。這樣的結(jié)構(gòu)適合對(duì)于密集型數(shù)據(jù)進(jìn)行并行計(jì)算,程序在GPU系統(tǒng)上運(yùn)行速度相較于單行的CPU往往提升幾十倍甚至上千倍。但是,GPU也有一定的局限性:深度學(xué)習(xí)算法分為訓(xùn)練和推斷兩個(gè)部分,GPU平臺(tái)在算法訓(xùn)練上是非常高效,但是在推斷中,由于單項(xiàng)輸入進(jìn)行處理的時(shí)候并行計(jì)算的優(yōu)勢(shì)不能完全發(fā)揮出來(lái)。此外,GPU無(wú)法單獨(dú)工作,必須由CPU進(jìn)行控制調(diào)用才能工作,而且功耗比較高。

FPGA:FPGA全稱現(xiàn)場(chǎng)可編程門陣列,與GPU不同的是,F(xiàn)PGA同時(shí)擁有硬件流水線并行和數(shù)據(jù)并行處理能力,適用于以硬件流水線方式處理一條數(shù)據(jù),且整體運(yùn)算性更高。因此,常用于深度學(xué)習(xí)算法中的推斷階段。不過(guò),F(xiàn)PGA通過(guò)硬件的配置實(shí)現(xiàn)軟件算法,因此在實(shí)現(xiàn)復(fù)雜算法方面有一定的難度。相比于CPU,F(xiàn)PGA因?yàn)闆](méi)有數(shù)據(jù)和指令存儲(chǔ)和讀取的功能,速度會(huì)變得更快,而功耗會(huì)更低。那么它的劣勢(shì)就是價(jià)格比較高,編程相對(duì)復(fù)雜,而且整體運(yùn)算能力不是很高。

ASIC:ASIC是專用集成電路,是專用的定制芯片,即是為實(shí)現(xiàn)特定要求而定制的芯片。定制的特性有助于提高ASIC的性能功耗比,缺點(diǎn)是電路設(shè)計(jì)需要定制,相對(duì)開(kāi)發(fā)周期長(zhǎng),功能難以擴(kuò)展。但在功耗、可靠性、集成度等方面都有優(yōu)勢(shì),尤其在要求高性能、低功耗的移動(dòng)端體現(xiàn)非常明顯。因此在深度學(xué)習(xí)算法穩(wěn)定后,AI芯片可以采用ASIC設(shè)計(jì)方法進(jìn)行全面定制,使性能、功耗和面積等指標(biāo)面向深度學(xué)習(xí)的算法做到最優(yōu)。

神經(jīng)擬態(tài)芯片,也就是類腦芯片。神經(jīng)擬態(tài)計(jì)算是模擬生物神經(jīng)網(wǎng)絡(luò)的計(jì)算機(jī)制,神經(jīng)擬態(tài)計(jì)算是從結(jié)構(gòu)層面去逼近大腦。這種芯片把定制化的數(shù)字處理內(nèi)核當(dāng)作神經(jīng)元,把內(nèi)存作為突觸。其邏輯結(jié)構(gòu)與傳統(tǒng)的馮·諾依曼結(jié)構(gòu)完全不同,它的內(nèi)存、CPU和通信部件完全是集成在一起,因此信息的處理在本地進(jìn)行,克服了傳統(tǒng)計(jì)算機(jī)的內(nèi)存和CPU之間的速度瓶頸問(wèn)題。同時(shí),神經(jīng)元之間可以方便快捷地相互溝通,只要接收到其他的神經(jīng)元發(fā)過(guò)來(lái)的脈沖,那么這些神經(jīng)元就會(huì)同時(shí)做出反應(yīng)和動(dòng)作。

AI芯片的發(fā)展

AI芯片的發(fā)展向著更低功耗、更接近人腦、更靠近邊緣的方向發(fā)展。現(xiàn)在用于深度學(xué)習(xí)的AI芯片,為了實(shí)現(xiàn)深度學(xué)習(xí)的龐大乘積累加運(yùn)算和實(shí)現(xiàn)計(jì)算的高性能,芯片面積越做越大,帶來(lái)了成本和散熱等問(wèn)題。AI芯片編程的成熟度和芯片的安全以及神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性等問(wèn)題也都未能得到很好的解決。因此在現(xiàn)有的基礎(chǔ)上進(jìn)行改進(jìn)和完善此類芯片,仍然是當(dāng)前的主要研究方向。最終,AI芯片將進(jìn)一步提高智能,向著更接近人腦的高度智能方向不斷發(fā)展,并且向著邊緣逐步移動(dòng),以獲得更低的能耗。AI芯片的發(fā)展,計(jì)算范式隨著創(chuàng)新方向以及硬件實(shí)現(xiàn),AI硬件加速技術(shù)已經(jīng)逐漸走向成熟。未來(lái)可能會(huì)有更多的創(chuàng)業(yè)會(huì)來(lái)自電路和器件級(jí)技術(shù)的結(jié)合,比如存內(nèi)計(jì)算、類腦計(jì)算,或者是針對(duì)特殊的計(jì)算模式或者是新模型,還會(huì)有稀疏化計(jì)算和近似計(jì)算。關(guān)于深度計(jì)算的研究,也將持續(xù)進(jìn)行。

為搭建汽車芯片產(chǎn)業(yè)上下游聯(lián)動(dòng)發(fā)展的平臺(tái),上海市集成電路行業(yè)協(xié)會(huì)、上海市交通電子行業(yè)協(xié)會(huì)依托上海汽車芯片產(chǎn)業(yè)聯(lián)盟、ATC汽車技術(shù)平臺(tái),并聯(lián)合江、浙、皖三地半導(dǎo)體行業(yè)協(xié)會(huì)等單位,定于11月12-13日在上海舉辦“2024汽車與新能源芯片生態(tài)大會(huì)暨第四屆長(zhǎng)三角汽車芯片對(duì)接交流會(huì)”,本屆峰會(huì)將重點(diǎn)討論:芯片平臺(tái)的搭建和設(shè)計(jì),車載芯片在自動(dòng)駕駛、智能座艙、車載網(wǎng)絡(luò)、新能源三電等等的需求及應(yīng)用案例,最新芯片設(shè)計(jì)、安全、測(cè)試、封裝測(cè)試及三代半材料工藝等等熱點(diǎn)技術(shù)問(wèn)題深入探討,共同交流!同時(shí)建立一個(gè)您與終端用戶、行業(yè)專家、上下游產(chǎn)業(yè)鏈技術(shù)與項(xiàng)目交流的絕佳平臺(tái)

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4709

    瀏覽量

    95362
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49011

    瀏覽量

    249371
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35904
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    請(qǐng)問(wèn)編譯純r(jià)tos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?

    編譯純r(jià)tos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?
    發(fā)表于 07-11 07:22

    ADS1298 tdr的值到底是多大,跟采樣率等有沒(méi)有什么關(guān)系?

    我想請(qǐng)問(wèn)一下, 1、tdr的值到底是多大,跟采樣率等有沒(méi)有什么關(guān)系。數(shù)據(jù)手冊(cè)上只找到建立時(shí)間,好像沒(méi)有這個(gè)時(shí)間的值,28頁(yè)那個(gè)最小SCLK時(shí)鐘為110khz是怎么計(jì)算的。 2、 tdr到底是
    發(fā)表于 02-13 06:11

    ADS1298的操作溫度范圍到底是多少?

    ADS1298是 0°Cto +70°C;工業(yè)級(jí)ADS1298I 是 –40°Cto +85°C。 現(xiàn)在不知道ADS1298的操作溫度范圍到底是多少?
    發(fā)表于 02-10 07:19

    ADS1298ECG-FE原理圖上看見(jiàn)很多NI的符號(hào), 到底是什么意思呢?

    我們?cè)贏DS1298ECG-FE原理圖上看見(jiàn)很多NI的符號(hào), 到底是什么意思呢? 具體的值是多少呢? 如下面兩個(gè)圖所示: R1, R2電阻的值是多少? 這個(gè)比較重要。 R59 - R66又是多少? 麻煩你們回答一下。 謝謝
    發(fā)表于 02-05 08:16

    ADS1278的參考電壓的要求到底是怎樣的?

    <27MHz為例,Vrefp輸入范圍為0.5到3.1V 而后文又提到,參考輸入電壓的范圍為AGND-0.4v to AVDD+0.4v 問(wèn)題1. 這個(gè)參考電壓的要求到底是怎樣的? 問(wèn)題2.
    發(fā)表于 01-23 08:02

    ADS7864采樣頻率到底是由外部時(shí)鐘決定還是HOLDX信號(hào)頻率決定?

    ADS7864數(shù)據(jù)手冊(cè)上說(shuō)當(dāng)采用8M外部時(shí)鐘的時(shí)候,采樣頻率為500kHz,但是有人說(shuō)可以通過(guò)HOLDX頻率來(lái)控制采樣頻率,一個(gè)HOLDX下降沿采樣一次,HOLDX頻率就是采樣頻率。請(qǐng)問(wèn)采樣頻率到底是由外部時(shí)鐘決定還是HOLDX信號(hào)頻率決定?
    發(fā)表于 01-14 06:47

    TLV320AIC3254內(nèi)部中的ADC處理模塊和minidsp到底是什么關(guān)系?

    我想請(qǐng)問(wèn)一下幾個(gè)問(wèn)題: 1.3254內(nèi)部中的ADC處理模塊和minidsp到底是什么關(guān)系,是并列的還是串行關(guān)系?還是ADC處理模塊就是minidsp特殊情況下的部分? 2.minidsp的抽取因子該怎么理解,到底怎么使用?
    發(fā)表于 10-31 06:02

    請(qǐng)問(wèn)TPA3130D2的芯片絲印到底是PTPA3130還是TPA3130呀?

    TPA3130D2的芯片絲印到底是PTPA3130還是TPA3130呀
    發(fā)表于 10-23 06:13

    請(qǐng)問(wèn)PCM2903C的溫度范圍到底是多少呢?

    如下圖,PCM2903C的溫度范圍到底是多少呢? 如果用在-25~85℃,是否會(huì)出問(wèn)題?
    發(fā)表于 10-14 07:14

    放大器的共模輸入電壓到底是指什么?

    請(qǐng)問(wèn)放大器的共模輸入電壓到底是指什么?
    發(fā)表于 09-19 07:17

    功放和運(yùn)放到底是什么區(qū)別?

    想請(qǐng)問(wèn)一下功放和運(yùn)放到底是什么區(qū)別,感覺(jué)只要接一個(gè)小負(fù)載,運(yùn)放的輸出電流也可以很大?。?b class='flag-5'>到底有什么區(qū)別啊
    發(fā)表于 09-10 07:00

    請(qǐng)問(wèn)LMV772到底是雙電源還是單電源?。?/a>

    請(qǐng)問(wèn)LMV772到底是雙電源還是單電源???手冊(cè)前面寫的太模糊了。求指教
    發(fā)表于 09-09 07:10

    運(yùn)放的輸入電容到底是什么?

    我想請(qǐng)問(wèn)一下運(yùn)放的輸入電容到底是什么?
    發(fā)表于 09-04 06:52

    LMH6502的輸入電壓到底是多少?

    LMH6502的輸入電壓到底是多少,我稍微給如大一點(diǎn)點(diǎn)的信號(hào),放大不行還能接受,我衰減都失真,
    發(fā)表于 08-27 07:02

    運(yùn)放旁路電容必須靠近芯片引腳的原因到底是什么呢?

    運(yùn)放旁路電容必須靠近芯片引腳的原因到底是什么呢?有的說(shuō)是怕走線的電感與旁路電容形成諧振,旁路電容靠近運(yùn)放的時(shí)候走線的電感不應(yīng)該更大了嗎(走線越長(zhǎng),走線的寄生電感也就越大)
    發(fā)表于 08-01 06:56