chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如今火熱的AI芯片到底是什么

拉拉 ? 來源:jf_35653895 ? 作者:jf_35653895 ? 2024-09-06 10:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

眾所周知,人工智能的三大基礎(chǔ)要素是數(shù)據(jù)、算法和算力,而這三大要素的核心就是AI芯片技術(shù)。隨著各項基于AIGC前沿科技的廣泛應用,AI對于算力的要求開始不斷地快速攀升。特別是深度學習成為當前AI研究和運用的主流方式,目前通用的CPU可以拿來執(zhí)行AI的算法。但是因為內(nèi)部有大量的非運算邏輯,而這些指令級對于目前的AI算法來說是完全用不上的,所以CPU并不能達到最高的運算效率。因此,具有海量并行計算能力并且能夠加速AI計算的AI芯片應運而生。

什么是AI芯片

從廣義上講,只要能夠進行人工智能算法或者面向AI計算應用的芯片都叫做AI芯片。但是,通常意義上的AI芯片指的是針對人工智能算法做了特殊加速設(shè)計的芯片。他們的目的就是為了更高效地執(zhí)行AI算法。

AI芯片的發(fā)展歷程

從圖靈的論文《計算機器與智能》和圖靈測試,到最初的神經(jīng)元模擬單元感知機,再到現(xiàn)在多達上百層的深度神經(jīng)網(wǎng)絡(luò),人類對人工智能的探索從來都沒有停止過。上世紀80年代,多層神經(jīng)網(wǎng)絡(luò)和反向傳播算法的出現(xiàn)給人工智能行業(yè)點燃了新的火花。1989年,貝爾實驗室成功利用了反向傳播算法在多層神經(jīng)網(wǎng)絡(luò)開發(fā)了一個手寫郵編識別器。1998年,兩位人工智能科學家楊立坤和約書亞·本杰奧發(fā)表了手寫識別神經(jīng)網(wǎng)絡(luò)和反向傳播優(yōu)化相關(guān)的論文,開創(chuàng)了卷積神經(jīng)網(wǎng)絡(luò)的時代。此后,人工智能陷入了長時間的發(fā)展沉寂階段,直到1997年IBM的深藍戰(zhàn)勝了國際象棋大師,和2011年IBM的沃森智能系統(tǒng)在《危險邊緣》節(jié)目中勝出,人工智能才又一次被人們所關(guān)注。2016年,阿爾法狗擊敗了韓國圍棋九段的職業(yè)選手,就標志著人工智能的又一波高潮。從基礎(chǔ)算法、底層硬件和工具框架到實際的應用場景,現(xiàn)階段的人工智能領(lǐng)域已經(jīng)全面開花。作為人工智能核心的底層硬件,AI芯片同樣也經(jīng)歷了多次的起伏和波折??傮w來看,AI芯片的發(fā)展前后經(jīng)歷了四次大的變化。

2007年以前,AI芯片產(chǎn)業(yè)一直沒有發(fā)展成為成熟的產(chǎn)業(yè),同時由于當時的算法、數(shù)據(jù)量等因素,這個階段的AI芯片并沒有特別強烈的市場需求,通用的CPU芯片即可滿足應用需求。隨著高清視頻、VR、AR、游戲等行業(yè)的發(fā)展,GPU產(chǎn)品得到了快速的突破,同時人們發(fā)現(xiàn)GPU的并行計算特性恰好適應人工智能算法及大數(shù)據(jù)并行計算的需求。如GPU比之前傳統(tǒng)的CPU在深度學習算法的運算上可以提升幾十倍的效率,因此開始嘗試使用GPU進行人工智能計算。進入2010年后,云計算開始廣泛推廣,人工智能的研究人員通過云計算借助大量的CPU和GPU進行混合運算,進一步推進了AI芯片的深入應用,從而催生了各類AI芯片的研發(fā)和應用。人工智能對于計算能力的要求在不斷地提升,進入2015年后,GPU性能功耗比不高的特點使其在工作適用場合受到多種限制,業(yè)界開始研發(fā)針對人工智能的專用芯片,以其通過更好的硬件和芯片架構(gòu)在計算效率、能耗比等性能上得到進一步的提升。

AI芯片的分類

首先,從AI芯片的功能來看,AI實現(xiàn)包括兩個環(huán)節(jié):訓練和推理。

所以根據(jù)承擔的任務(wù)不同,AI芯片可以分為基于構(gòu)建神經(jīng)網(wǎng)絡(luò)模型的訓練芯片,和利用神經(jīng)網(wǎng)絡(luò)模型進行推理預測的推理芯片。訓練環(huán)節(jié)通常需要通過大量的數(shù)據(jù)輸入,訓練出一個復雜的深度神經(jīng)網(wǎng)絡(luò)模型。訓練過程由于涉及海量的訓練數(shù)據(jù)和復雜的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),運算量非常巨大,需要龐大的計算規(guī)模。對于處理器的計算能力、精度、可擴展性的性能要求非常高。比如英偉達的H100,基于FP16的算力達到了2000TOPS,即每秒可以進行2,000萬億次的操作。而推理則是利用訓練好的模型,使用新的數(shù)據(jù)去推理出各種結(jié)論。這個環(huán)節(jié)的計算量相對于訓練環(huán)節(jié)就少很多,但是仍然會涉及到大量的矩陣運算。比如英偉達的T4,基于INT8的算力為1,300TOPS。因此,訓練芯片注重絕對的計算能力,而推理芯片更注重的是綜合指標,單位能耗、算力、延時等各項成本都需要考慮。

從AI芯片的應用場景來看,也可以分為兩大類:服務(wù)器端和移動端,也可以說是云端和終端。

服務(wù)器端,從剛剛提到的訓練階段,由于數(shù)據(jù)量和運算量巨大,單一的處理器幾乎不可能獨立完成一個模型的訓練過程,因此訓練環(huán)節(jié)只能在云端實現(xiàn)。而推理階段,由于訓練出來的深度神經(jīng)網(wǎng)絡(luò)模型仍然非常復雜,推理過程仍然屬于計算密集型和存儲密集型,同樣可以選擇部署在服務(wù)器端。移動端,如手機智能家居無人駕駛,移動端AI芯片在設(shè)計思路上與服務(wù)器端的AI芯片有著本質(zhì)的區(qū)別。首先,它們對計算的能效要求非常之高;其次,在智能駕駛等實時性要求很高的場合,推理過程必須在設(shè)備本身完成,因此要求移動設(shè)備具備足夠的推理能力。而某些場合還會有低功耗、低延遲、低成本的要求,從而要求移動端的AI芯片更是多種多樣??偟膩碚f,服務(wù)器端AI芯片的特點是性能強大,并且能夠支持大量運算;而移動端的AI芯片特點是體積小、耗電少,并且有很快的計算效率。

最后,還可以從技術(shù)架構(gòu)來劃分,比如GPU、FPGAASIC和類腦芯片。

GPU:傳統(tǒng)的CPU之所以不適合人工智能算法的執(zhí)行,主要原因是在于計算指令遵循著串行執(zhí)行的,沒有辦法發(fā)揮出芯片的全部潛力。CPU大部分面積為控制器寄存器,而GPU擁有更多的邏輯運算單元,用于數(shù)據(jù)處理。這樣的結(jié)構(gòu)適合對于密集型數(shù)據(jù)進行并行計算,程序在GPU系統(tǒng)上運行速度相較于單行的CPU往往提升幾十倍甚至上千倍。但是,GPU也有一定的局限性:深度學習算法分為訓練和推斷兩個部分,GPU平臺在算法訓練上是非常高效,但是在推斷中,由于單項輸入進行處理的時候并行計算的優(yōu)勢不能完全發(fā)揮出來。此外,GPU無法單獨工作,必須由CPU進行控制調(diào)用才能工作,而且功耗比較高。

FPGA:FPGA全稱現(xiàn)場可編程門陣列,與GPU不同的是,F(xiàn)PGA同時擁有硬件流水線并行和數(shù)據(jù)并行處理能力,適用于以硬件流水線方式處理一條數(shù)據(jù),且整體運算性更高。因此,常用于深度學習算法中的推斷階段。不過,F(xiàn)PGA通過硬件的配置實現(xiàn)軟件算法,因此在實現(xiàn)復雜算法方面有一定的難度。相比于CPU,F(xiàn)PGA因為沒有數(shù)據(jù)和指令存儲和讀取的功能,速度會變得更快,而功耗會更低。那么它的劣勢就是價格比較高,編程相對復雜,而且整體運算能力不是很高。

ASIC:ASIC是專用集成電路,是專用的定制芯片,即是為實現(xiàn)特定要求而定制的芯片。定制的特性有助于提高ASIC的性能功耗比,缺點是電路設(shè)計需要定制,相對開發(fā)周期長,功能難以擴展。但在功耗、可靠性、集成度等方面都有優(yōu)勢,尤其在要求高性能、低功耗的移動端體現(xiàn)非常明顯。因此在深度學習算法穩(wěn)定后,AI芯片可以采用ASIC設(shè)計方法進行全面定制,使性能、功耗和面積等指標面向深度學習的算法做到最優(yōu)。

神經(jīng)擬態(tài)芯片,也就是類腦芯片。神經(jīng)擬態(tài)計算是模擬生物神經(jīng)網(wǎng)絡(luò)的計算機制,神經(jīng)擬態(tài)計算是從結(jié)構(gòu)層面去逼近大腦。這種芯片把定制化的數(shù)字處理內(nèi)核當作神經(jīng)元,把內(nèi)存作為突觸。其邏輯結(jié)構(gòu)與傳統(tǒng)的馮·諾依曼結(jié)構(gòu)完全不同,它的內(nèi)存、CPU和通信部件完全是集成在一起,因此信息的處理在本地進行,克服了傳統(tǒng)計算機的內(nèi)存和CPU之間的速度瓶頸問題。同時,神經(jīng)元之間可以方便快捷地相互溝通,只要接收到其他的神經(jīng)元發(fā)過來的脈沖,那么這些神經(jīng)元就會同時做出反應和動作。

AI芯片的發(fā)展

AI芯片的發(fā)展向著更低功耗、更接近人腦、更靠近邊緣的方向發(fā)展?,F(xiàn)在用于深度學習的AI芯片,為了實現(xiàn)深度學習的龐大乘積累加運算和實現(xiàn)計算的高性能,芯片面積越做越大,帶來了成本和散熱等問題。AI芯片編程的成熟度和芯片的安全以及神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性等問題也都未能得到很好的解決。因此在現(xiàn)有的基礎(chǔ)上進行改進和完善此類芯片,仍然是當前的主要研究方向。最終,AI芯片將進一步提高智能,向著更接近人腦的高度智能方向不斷發(fā)展,并且向著邊緣逐步移動,以獲得更低的能耗。AI芯片的發(fā)展,計算范式隨著創(chuàng)新方向以及硬件實現(xiàn),AI硬件加速技術(shù)已經(jīng)逐漸走向成熟。未來可能會有更多的創(chuàng)業(yè)會來自電路和器件級技術(shù)的結(jié)合,比如存內(nèi)計算、類腦計算,或者是針對特殊的計算模式或者是新模型,還會有稀疏化計算和近似計算。關(guān)于深度計算的研究,也將持續(xù)進行。

為搭建汽車芯片產(chǎn)業(yè)上下游聯(lián)動發(fā)展的平臺,上海市集成電路行業(yè)協(xié)會、上海市交通電子行業(yè)協(xié)會依托上海汽車芯片產(chǎn)業(yè)聯(lián)盟、ATC汽車技術(shù)平臺,并聯(lián)合江、浙、皖三地半導體行業(yè)協(xié)會等單位,定于11月12-13日在上海舉辦“2024汽車與新能源芯片生態(tài)大會暨第四屆長三角汽車芯片對接交流會”,本屆峰會將重點討論:芯片平臺的搭建和設(shè)計,車載芯片在自動駕駛、智能座艙、車載網(wǎng)絡(luò)、新能源三電等等的需求及應用案例,最新芯片設(shè)計、安全、測試、封裝測試及三代半材料工藝等等熱點技術(shù)問題深入探討,共同交流!同時建立一個您與終端用戶、行業(yè)專家、上下游產(chǎn)業(yè)鏈技術(shù)與項目交流的絕佳平臺

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4739

    瀏覽量

    96718
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49497

    瀏覽量

    258152
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2031

    瀏覽量

    36369
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于AI
    發(fā)表于 09-12 16:07

    IEC 到底是什么?為什么它能影響全球?

    IEC 到底是什么?為什么它能影響全球?
    的頭像 發(fā)表于 09-04 17:07 ?1488次閱讀

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    名單公布 @LiuDW、@jinglixixi、@bruceleesohu 請于9月3日前,前往【書籍評測活動NO.64】《AI芯片:科技探索與AGI愿景》完成書籍兌換。 如有疑問請 添加小助手微信
    發(fā)表于 07-28 13:54

    晶振的 “負載電容” 到底是什么

    負載電容,到底是什么? 負載電容,簡單來說,是指晶振的兩條引線連接IC塊內(nèi)部及外部所有有效電容之和,我們可以將其看作晶振片在電路中串接的電容。從更專業(yè)的角度講,它是為了使晶振能夠在其標稱頻率下穩(wěn)定
    的頭像 發(fā)表于 07-25 16:26 ?457次閱讀

    請問編譯純rtos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?

    編譯純rtos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?
    發(fā)表于 07-11 07:22

    ADS1298 RDATAC Opcode時,START到底是低還是高?

    您好,1298的datasheet看到這有點糊涂了。 1、RDATAC Opcode時,START到底是低還是高? 從時序圖上看實線是高、虛線是低,請問實線虛線有什么區(qū)別? 2、同時在DOUT
    發(fā)表于 02-14 07:48

    ADS1298 tdr的值到底是多大,跟采樣率等有沒有什么關(guān)系?

    我想請問一下, 1、tdr的值到底是多大,跟采樣率等有沒有什么關(guān)系。數(shù)據(jù)手冊上只找到建立時間,好像沒有這個時間的值,28頁那個最小SCLK時鐘為110khz是怎么計算的。 2、 tdr到底是
    發(fā)表于 02-13 06:11

    ADS1298的操作溫度范圍到底是多少?

    ADS1298是 0°Cto +70°C;工業(yè)級ADS1298I 是 –40°Cto +85°C。 現(xiàn)在不知道ADS1298的操作溫度范圍到底是多少?
    發(fā)表于 02-10 07:19

    ADS1298ECG-FE原理圖上看見很多NI的符號, 到底是什么意思呢?

    我們在ADS1298ECG-FE原理圖上看見很多NI的符號, 到底是什么意思呢? 具體的值是多少呢? 如下面兩個圖所示: R1, R2電阻的值是多少? 這個比較重要。 R59 - R66又是多少? 麻煩你們回答一下。 謝謝
    發(fā)表于 02-05 08:16

    ADS1278的參考電壓的要求到底是怎樣的?

    <27MHz為例,Vrefp輸入范圍為0.5到3.1V 而后文又提到,參考輸入電壓的范圍為AGND-0.4v to AVDD+0.4v 問題1. 這個參考電壓的要求到底是怎樣的? 問題2.
    發(fā)表于 01-23 08:02

    ADS7864采樣頻率到底是由外部時鐘決定還是HOLDX信號頻率決定?

    ADS7864數(shù)據(jù)手冊上說當采用8M外部時鐘的時候,采樣頻率為500kHz,但是有人說可以通過HOLDX頻率來控制采樣頻率,一個HOLDX下降沿采樣一次,HOLDX頻率就是采樣頻率。請問采樣頻率到底是由外部時鐘決定還是HOLDX信號頻率決定?
    發(fā)表于 01-14 06:47

    LM629 PID參數(shù)調(diào)節(jié),所謂的高頻震蕩到底是什么意思?

    為何我的系統(tǒng)一直沒有所謂的高頻震蕩這種現(xiàn)象;只是隨著Kd的增加,系統(tǒng)的阻尼開始變大而已。所謂的高頻震蕩到底是什么意思?
    發(fā)表于 01-01 07:30

    DAC3283到底是8位的LVDS輸入數(shù)據(jù)還是16位的LVDS輸入數(shù)據(jù)?

    請問這個DAC到底是8位的LVDS輸入數(shù)據(jù)還是16位的LVDS輸入數(shù)據(jù)啊。。也就是說,這個I路的15:8和7:0,是一個16位數(shù)據(jù)拆成了兩部分,高八位和第八位(其中又包含P和N),還是一個8位
    發(fā)表于 12-31 08:27

    TLV320AIC3254內(nèi)部中的ADC處理模塊和minidsp到底是什么關(guān)系?

    我想請問一下幾個問題: 1.3254內(nèi)部中的ADC處理模塊和minidsp到底是什么關(guān)系,是并列的還是串行關(guān)系?還是ADC處理模塊就是minidsp特殊情況下的部分? 2.minidsp的抽取因子該怎么理解,到底怎么使用?
    發(fā)表于 10-31 06:02

    請問TPA3130D2的芯片絲印到底是PTPA3130還是TPA3130呀?

    TPA3130D2的芯片絲印到底是PTPA3130還是TPA3130呀
    發(fā)表于 10-23 06:13