FPGA > GPU > CPU,產(chǎn)生這樣結(jié)果的根本原因:對(duì)于計(jì)算密集型算法,數(shù)據(jù)的搬移和運(yùn)算效率越高的能耗比就越高。ASIC和FPGA都是更接近底層IO,所以計(jì)算效率高和數(shù)據(jù)搬移高,但是FPGA有冗余晶體管和連線(xiàn),運(yùn)行頻率低,所以沒(méi)有ASIC能耗比高。GPU和CPU都是屬于通用處理器,都需要進(jìn)行取指令、指令譯碼、指令執(zhí)行的過(guò)程,通過(guò)這種方式屏蔽了底層IO的處理,使得軟硬件解耦,但帶來(lái)數(shù)據(jù)的搬移和運(yùn)算無(wú)法達(dá)到更高效率,所以沒(méi)有ASIC、FPGA能耗比高。GPU和CPU之間的能耗比的差距,主要在于CPU中晶體管有大部分用在cache和控制邏輯單元,所以CPU相比GPU來(lái)說(shuō),對(duì)于計(jì)算密集同時(shí)計(jì)算復(fù)雜度低的算法,有冗余的晶體管無(wú)法發(fā)揮作用,能耗比上CPU低于GPU。" />

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU將失寵,ASIC 才是AI 前景所在

M8kW_icbank ? 來(lái)源:未知 ? 作者:伍文輝 ? 2018-01-02 15:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPU人工智能AI)運(yùn)算大放異彩,激勵(lì)兩家GPU 大廠(chǎng)Nvidia、超微(AMD)股價(jià)狂飆。但是分析師警告,明年GPU 在A(yíng)I 的地位,也許會(huì)遭「特殊應(yīng)用集成電路」(ASIC)取代。

12 日Nvidia 下跌1.96%,13 日續(xù)跌2.44% 收在186.18 美元。12 日超微下跌2.56%,13 日反彈2.12% 收在10.11 美元。

MarketWatch、Smarter Analyst報(bào)導(dǎo),Susquehanna分析師Christopher Rolland 12日?qǐng)?bào)告稱(chēng),2017年AI GPU當(dāng)?shù)溃?018年可能換成ASIC發(fā)威。AI運(yùn)用深度學(xué)習(xí)解決真實(shí)世界問(wèn)題,也使用在語(yǔ)音和影像辨識(shí)、自動(dòng)駕駛、醫(yī)療等,Nvidia是AI工作量大增的受惠者,股價(jià)暴沖。不過(guò),Susquehanna和多位業(yè)界領(lǐng)袖討論,判斷ASIC可能會(huì)取代GPU。

Rolland 以虛擬貨幣挖礦為例,解釋此一變化。早期礦工挖掘虛幣時(shí),多用GPU,不過(guò)隨著挖礦難度不斷提高,礦工逐漸改用ASIC?,F(xiàn)在比特幣礦工多半采用ASIC,以太幣礦工也會(huì)在今年改用ASIC。市面上更出現(xiàn)以太幣專(zhuān)用ASIC,效能遠(yuǎn)勝GPU。

報(bào)告稱(chēng),Nvidia 有ASIC 相關(guān)部門(mén),未來(lái)仍會(huì)在A(yíng)I 扮演重要角色。但是市場(chǎng)將有更多競(jìng)爭(zhēng)者,有望受惠的ASIC 業(yè)者,包括協(xié)助谷歌研發(fā)AI 芯片的博通、Cavium、Marvell、Microsemi 等。

另外,現(xiàn)場(chǎng)可程式化閘陣列(Field-Programmable Gate Array,FPGA)也可能從AI 熱潮沾光,賽靈思(Xilinx)的FPGA 就用于亞馬遜云端服務(wù)。

芯片商Cerebras 正在研發(fā)AI 專(zhuān)用的ASIC,該公司執(zhí)行長(zhǎng)Andrew Feldman 強(qiáng)調(diào),GPU 并非最適合AI 運(yùn)算的芯片。GPU 原本是為了電玩開(kāi)發(fā),如今卻碰巧適用于另一個(gè)毫不相干的新市場(chǎng)。這種幸運(yùn)的巧合不會(huì)發(fā)生,最可能的解釋是,GPU 只是當(dāng)前最佳的解決方案,讓業(yè)界能繼續(xù)往前,暗示ASIC 才是AI 前景所在。

Barron's.com 8 月23 日?qǐng)?bào)導(dǎo),摩根士丹利(Morgan Stanley,通稱(chēng)大摩)發(fā)表研究報(bào)告指出,現(xiàn)場(chǎng)可程式化閘陣列在機(jī)器學(xué)習(xí)進(jìn)行「推論」(inference)時(shí)扮演的角色,可能比市場(chǎng)想像還要大,Xilinx 有望受惠。

GPU、FPGA、ASIC,誰(shuí)更適合人工智能?

圍繞著人工智能的計(jì)算,有上述三種方案,我們來(lái)看一下哪一種會(huì)是AI首選。

GPU主要擅長(zhǎng)做類(lèi)似圖像處理的并行計(jì)算,所謂的“粗粒度并行(coarse-grain parallelism)”。圖形處理計(jì)算的特征表現(xiàn)為高密度的計(jì)算而計(jì)算需要的數(shù)據(jù)之間較少存在相關(guān)性,GPU 提供大量的計(jì)算單元(多達(dá)幾千個(gè)計(jì)算單元)和大量的高速內(nèi)存,可以同時(shí)對(duì)很多像素進(jìn)行并行處理。

GPU中一個(gè)邏輯控制單元對(duì)應(yīng)多個(gè)計(jì)算單元,同時(shí)要想計(jì)算單元充分并行起來(lái),邏輯控制必然不會(huì)太復(fù)雜,太復(fù)雜的邏輯控制無(wú)法發(fā)揮計(jì)算單元的并行度,例如過(guò)多的if…else if…else if… 分支計(jì)算就無(wú)法提高計(jì)算單元的并行度,所以在GPU中邏輯控制單元也就不需要能夠快速處理復(fù)雜控制。

這里GPU計(jì)算能力用Nvidia的Tesla K40進(jìn)行分析,K40包含2880個(gè)流處理器(Stream Processor),流處理器就是GPU的計(jì)算單元。每個(gè)流處理器包含一個(gè)32bit單精度浮點(diǎn)乘和加單元,即每個(gè)時(shí)鐘周期可以做2個(gè)單精度浮點(diǎn)計(jì)算。GPU峰值浮點(diǎn)計(jì)算性能 = 流處理器個(gè)數(shù) GPU頻率 每周期執(zhí)行的浮點(diǎn)操作數(shù)。以K40為例,K40峰值浮點(diǎn)計(jì)算性能= 2880(流處理器) 745MHz 2(乘和加) = 4.29T FLOPs/s即每秒4.29T峰值浮點(diǎn)計(jì)算能力。

GPU芯片結(jié)構(gòu)是否可以充分發(fā)揮浮點(diǎn)計(jì)算能力?GPU同CPU一樣也是指令執(zhí)行過(guò)程:取指令 ->指令譯碼 ->指令執(zhí)行,只有在指令執(zhí)行的時(shí)候,計(jì)算單元才發(fā)揮作用。GPU的邏輯控制單元相比CPU簡(jiǎn)單,所以要想做到指令流水處理,提高指令執(zhí)行效率,必然要求處理的算法本身復(fù)雜度低,處理的數(shù)據(jù)之間相互獨(dú)立,所以算法本身的串行處理會(huì)導(dǎo)致GPU浮點(diǎn)計(jì)算能力的顯著降低。

上圖是GPU的設(shè)計(jì)結(jié)構(gòu)。GPU的設(shè)計(jì)出發(fā)點(diǎn)在于GPU更適用于計(jì)算強(qiáng)度高、多并行的計(jì)算。因此,GPU把晶體管更多用于計(jì)算單元,而不像CPU用于數(shù)據(jù)Cache和流程控制器。這樣的設(shè)計(jì)是因?yàn)椴⑿杏?jì)算時(shí)每個(gè)數(shù)據(jù)單元執(zhí)行相同程序,不需要繁瑣的流程控制而更需要高計(jì)算能力,因此也不需要大的cache容量。

FPGA作為一種高性能、低功耗的可編程芯片,可以根據(jù)客戶(hù)定制來(lái)做針對(duì)性的算法設(shè)計(jì)。所以在處理海量數(shù)據(jù)的時(shí)候,F(xiàn)PGA 相比于CPU 和GPU,優(yōu)勢(shì)在于:FPGA計(jì)算效率更高,F(xiàn)PGA更接近IO。

FPGA不采用指令和軟件,是軟硬件合一的器件。對(duì)FPGA進(jìn)行編程要使用硬件描述語(yǔ)言,硬件描述語(yǔ)言描述的邏輯可以直接被編譯為晶體管電路的組合。所以FPGA實(shí)際上直接用晶體管電路實(shí)現(xiàn)用戶(hù)的算法,沒(méi)有通過(guò)指令系統(tǒng)的翻譯。

FPGA的英文縮寫(xiě)名翻譯過(guò)來(lái),全稱(chēng)是現(xiàn)場(chǎng)可編程邏輯門(mén)陣列,這個(gè)名稱(chēng)已經(jīng)揭示了FPGA的功能,它就是一堆邏輯門(mén)電路的組合,可以編程,還可以重復(fù)編程。上圖展示了可編程FPGA的內(nèi)部原理圖。

里FPGA計(jì)算能力用Xilinx的V7-690T進(jìn)行分析,V7-690T包含3600個(gè)DSP(Digital Signal Processing),DSP就是FPGA的計(jì)算單元。每個(gè)DSP可以在每個(gè)時(shí)鐘周期可以做2個(gè)單精度浮點(diǎn)計(jì)算(乘和加)。FPGA峰值浮點(diǎn)計(jì)算性能 = DSP個(gè)數(shù) FPGA頻率 每周期執(zhí)行的浮點(diǎn)操作數(shù)。V7-690T運(yùn)行頻率已250MHz來(lái)計(jì)算,V7-690T峰值浮點(diǎn)計(jì)算性能 = 3600(DSP個(gè)數(shù)) 250MHz 2(乘和加)=1.8T FLOPs/s即每秒1.8T峰值浮點(diǎn)計(jì)算能力。

FPGA芯片結(jié)構(gòu)是否可以充分發(fā)揮浮點(diǎn)計(jì)算能力?FPGA由于算法是定制的,所以沒(méi)有CPU和GPU的取指令和指令譯碼過(guò)程,數(shù)據(jù)流直接根據(jù)定制的算法進(jìn)行固定操作,計(jì)算單元在每個(gè)時(shí)鐘周期上都可以執(zhí)行,所以可以充分發(fā)揮浮點(diǎn)計(jì)算能力,計(jì)算效率高于CPU和GPU。

ASIC是一種專(zhuān)用芯片,與傳統(tǒng)的通用芯片有一定的差異。是為了某種特定的需求而專(zhuān)門(mén)定制的芯片。ASIC芯片的計(jì)算能力和計(jì)算效率都可以根據(jù)算法需要進(jìn)行定制,所以ASIC與通用芯片相比,具有以下幾個(gè)方面的優(yōu)越性:體積小、功耗低、計(jì)算性能高、計(jì)算效率高、芯片出貨量越大成本越低。但是缺點(diǎn)也很明顯:算法是固定的,一旦算法變化就可能無(wú)法使用。目前人工智能屬于大爆發(fā)時(shí)期,大量的算法不斷涌出,遠(yuǎn)沒(méi)有到算法平穩(wěn)期,ASIC專(zhuān)用芯片如何做到適應(yīng)各種算法是個(gè)最大的問(wèn)題,如果以目前CPU和GPU架構(gòu)來(lái)適應(yīng)各種算法,那ASIC專(zhuān)用芯片就變成了同CPU、GPU一樣的通用芯片,在性能和功耗上就沒(méi)有優(yōu)勢(shì)了。

我們來(lái)看看FPGA 和 ASIC 的區(qū)別。FPGA基本原理是在芯片內(nèi)集成大量的數(shù)字電路基本門(mén)電路以及存儲(chǔ)器,而用戶(hù)可以通過(guò)燒入 FPGA 配置文件來(lái)來(lái)定義這些門(mén)電路以及存儲(chǔ)器之間的連線(xiàn)。這種燒入不是一次性的,即用戶(hù)今天可以把 FPGA 配置成一個(gè)微控制器 MCU,明天可以編輯配置文件把同一個(gè) FPGA 配置成一個(gè)音頻編解碼器。ASIC 則是專(zhuān)用集成電路,一旦設(shè)計(jì)制造完成后電路就固定了,無(wú)法再改變。

比較 FPGA 和 ASIC 就像比較樂(lè)高積木和模型。舉例來(lái)說(shuō),如果你發(fā)現(xiàn)最近星球大戰(zhàn)里面 Yoda 大師很火,想要做一個(gè) Yoda 大師的玩具賣(mài),你要怎么辦呢?

有兩種辦法,一種是用樂(lè)高積木搭,還有一種是找工廠(chǎng)開(kāi)模定制。用樂(lè)高積木搭的話(huà),只要設(shè)計(jì)完玩具外形后去買(mǎi)一套樂(lè)高積木即可。而找工廠(chǎng)開(kāi)模的話(huà)在設(shè)計(jì)完玩具外形外你還需要做很多事情,比如玩具的材質(zhì)是否會(huì)散發(fā)氣味,玩具在高溫下是否會(huì)融化等等,所以用樂(lè)高積木來(lái)做玩具需要的前期工作比起找工廠(chǎng)開(kāi)模制作來(lái)說(shuō)要少得多,從設(shè)計(jì)完成到能夠上市所需要的時(shí)間用樂(lè)高也要快很多。

FPGA 和 ASIC 也是一樣,使用 FPGA 只要寫(xiě)完 Verilog 代碼就可以用 FPGA 廠(chǎng)商提供的工具實(shí)現(xiàn)硬件加速器了,而要設(shè)計(jì) ASIC 則還需要做很多驗(yàn)證和物理設(shè)計(jì) (ESD,Package 等等),需要更多的時(shí)間。如果要針對(duì)特殊場(chǎng)合(如軍事和工業(yè)等對(duì)于可靠性要求很高的應(yīng)用),ASIC 則需要更多時(shí)間進(jìn)行特別設(shè)計(jì)以滿(mǎn)足需求,但是用 FPGA 的話(huà)可以直接買(mǎi)軍工級(jí)的高穩(wěn)定性 FPGA 完全不影響開(kāi)發(fā)時(shí)間。但是,雖然設(shè)計(jì)時(shí)間比較短,但是樂(lè)高積木做出來(lái)的玩具比起工廠(chǎng)定制的玩具要粗糙(性能差)一些(下圖),畢竟工廠(chǎng)開(kāi)模是量身定制。

另外,如果出貨量大的話(huà),工廠(chǎng)大規(guī)模生產(chǎn)玩具的成本會(huì)比用樂(lè)高積木做便宜許多。FPGA 和 ASIC 也是如此,在同一時(shí)間點(diǎn)上用最好的工藝實(shí)現(xiàn)的 ASIC 的加速器的速度會(huì)比用同樣工藝 FPGA 做的加速器速度快 5-10 倍,而且一旦量產(chǎn)后 ASIC 的成本會(huì)遠(yuǎn)遠(yuǎn)低于 FPGA 方案。

FPGA 上市速度快, ASIC 上市速度慢,需要大量時(shí)間開(kāi)發(fā),而且一次性成本(光刻掩模制作成本)遠(yuǎn)高于 FPGA,但是性能高于 FPGA 且量產(chǎn)后平均成本低于 FPGA。目標(biāo)市場(chǎng)方面,F(xiàn)PGA 成本較高,所以適合對(duì)價(jià)格不是很敏感的地方,比如企業(yè)應(yīng)用,軍事和工業(yè)電子等等(在這些領(lǐng)域可重配置真的需要)。而 ASIC 由于低成本則適合消費(fèi)電子類(lèi)應(yīng)用,而且在消費(fèi)電子中可配置是否是一個(gè)偽需求還有待商榷。

我們看到的市場(chǎng)現(xiàn)狀也是如此:使用 FPGA 做深度學(xué)習(xí)加速的多是企業(yè)用戶(hù),百度、微軟、IBM 等公司都有專(zhuān)門(mén)做 FPGA 的團(tuán)隊(duì)為服務(wù)器加速,而做 FPGA 方案的初創(chuàng)公司 Teradeep 的目標(biāo)市場(chǎng)也是服務(wù)器。而 ASIC 則主要瞄準(zhǔn)消費(fèi)電子,如 Movidius。由于移動(dòng)終端屬于消費(fèi)電子領(lǐng)域,所以未來(lái)使用的方案應(yīng)當(dāng)是以 ASIC 為主。

由于不同的芯片生產(chǎn)工藝,對(duì)芯片的功耗和性能都有影響,這里用相同工藝或者接近工藝下進(jìn)行對(duì)比,ASIC芯片還沒(méi)有商用的芯片出現(xiàn),Google的TPU也只是自己使用沒(méi)有對(duì)外提供信息,這里ASIC芯片用在學(xué)術(shù)論文發(fā)表的《DianNao: A Small-Footprint High-Throughput Accelerator for Ubiquitous Machine-Learning》作為代表。

GPU將失寵,ASIC 才是AI 前景所在

從上面的對(duì)比來(lái)看,能耗比方面:ASIC > FPGA > GPU > CPU,產(chǎn)生這樣結(jié)果的根本原因:對(duì)于計(jì)算密集型算法,數(shù)據(jù)的搬移和運(yùn)算效率越高的能耗比就越高。ASIC和FPGA都是更接近底層IO,所以計(jì)算效率高和數(shù)據(jù)搬移高,但是FPGA有冗余晶體管和連線(xiàn),運(yùn)行頻率低,所以沒(méi)有ASIC能耗比高。GPU和CPU都是屬于通用處理器,都需要進(jìn)行取指令、指令譯碼、指令執(zhí)行的過(guò)程,通過(guò)這種方式屏蔽了底層IO的處理,使得軟硬件解耦,但帶來(lái)數(shù)據(jù)的搬移和運(yùn)算無(wú)法達(dá)到更高效率,所以沒(méi)有ASIC、FPGA能耗比高。GPU和CPU之間的能耗比的差距,主要在于CPU中晶體管有大部分用在cache和控制邏輯單元,所以CPU相比GPU來(lái)說(shuō),對(duì)于計(jì)算密集同時(shí)計(jì)算復(fù)雜度低的算法,有冗余的晶體管無(wú)法發(fā)揮作用,能耗比上CPU低于GPU。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22034

    瀏覽量

    618000
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1245

    瀏覽量

    122337
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4937

    瀏覽量

    131179
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279197

原文標(biāo)題:GPU將失寵,明年的AI市場(chǎng)看ASIC

文章出處:【微信號(hào):icbank,微信公眾號(hào):icbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    智算加速卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計(jì)算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒(méi)有發(fā)現(xiàn),現(xiàn)在越來(lái)越多的AI企業(yè)不光用
    的頭像 發(fā)表于 06-05 13:39 ?549次閱讀
    智算加速卡是什么東西?它真能在<b class='flag-5'>AI</b>戰(zhàn)場(chǎng)上干掉<b class='flag-5'>GPU</b>和TPU!

    Imagination與澎峰科技攜手推動(dòng)GPU+AI解決方案,共拓計(jì)算生態(tài)

    的深度融合展開(kāi)合作。雙方結(jié)合 Imagination 領(lǐng)先的 GPU IP 技術(shù)與澎峰科技在 AI 模型壓縮與性能優(yōu)化方面的軟硬協(xié)同能力,共同開(kāi)拓面向 AI 行業(yè)應(yīng)用的計(jì)算解決方案
    發(fā)表于 05-21 09:40 ?993次閱讀

    FPGA+AI王炸組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    和國(guó)產(chǎn)替代的加速將進(jìn)一步擴(kuò)大其市場(chǎng)應(yīng)用范圍。 三、關(guān)于FPGA工程師的前景——“AI加持的FPGA工程師該如何發(fā)揮最大價(jià)值?”已知AI時(shí)代的FPGA行業(yè)面臨重大變化作為FPGA工程
    發(fā)表于 03-03 11:21

    AI推理帶火的ASIC,開(kāi)發(fā)成敗在此一舉!

    的應(yīng)用性?xún)r(jià)比遠(yuǎn)超GPU,加上博通財(cái)報(bào)AI業(yè)務(wù)同比大增220%,掀起了AI推理端的ASIC熱潮。 ? 那么ASIC跟傳統(tǒng)的
    的頭像 發(fā)表于 03-03 00:13 ?3272次閱讀
    <b class='flag-5'>AI</b>推理帶火的<b class='flag-5'>ASIC</b>,開(kāi)發(fā)成敗在此一舉!

    ASICGPU的原理和優(yōu)勢(shì)

    ? 本文介紹了ASICGPU兩種能夠用于AI計(jì)算的半導(dǎo)體芯片各自的原理和優(yōu)勢(shì)。 ASICGPU是什么
    的頭像 發(fā)表于 01-06 13:58 ?1724次閱讀
    <b class='flag-5'>ASIC</b>和<b class='flag-5'>GPU</b>的原理和優(yōu)勢(shì)

    NVIDIA和GeForce RTX GPU專(zhuān)為AI時(shí)代打造

    NVIDIA 和 GeForce RTX GPU 專(zhuān)為 AI 時(shí)代打造。
    的頭像 發(fā)表于 01-06 10:45 ?649次閱讀

    英偉達(dá)組建ASIC團(tuán)隊(duì),挖掘臺(tái)灣設(shè)計(jì)服務(wù)人才

    英偉達(dá)自2024年中旬起,便開(kāi)始了從臺(tái)灣地區(qū)半導(dǎo)體公司挖掘設(shè)計(jì)服務(wù)人才的行動(dòng)。這一系列舉措旨在組建自家的ASIC(專(zhuān)用集成電路)團(tuán)隊(duì),以在現(xiàn)有的Tensor Core GPU之外,開(kāi)辟一條全新的AI
    的頭像 發(fā)表于 01-03 14:39 ?669次閱讀

    GPU是如何訓(xùn)練AI大模型的

    AI模型的訓(xùn)練過(guò)程中,大量的計(jì)算工作集中在矩陣乘法、向量加法和激活函數(shù)等運(yùn)算上。這些運(yùn)算正是GPU所擅長(zhǎng)的。接下來(lái),AI部落小編帶您了解GPU是如何訓(xùn)練
    的頭像 發(fā)表于 12-19 17:54 ?725次閱讀

    ASIC爆火!大廠(chǎng)AI訓(xùn)練推理拋棄GPU;博通的護(hù)城河有多深?

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)在上周末,博通應(yīng)該可以說(shuō)是投資圈和科技圈最火爆的話(huà)題,大家紛紛驚呼“英偉達(dá)的對(duì)手終于出現(xiàn)了!”“ASIC要超越GPU”云云。 ? 這一切都要源于上周五博通公布的炸裂財(cái)報(bào)
    的頭像 發(fā)表于 12-18 01:25 ?3096次閱讀

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    CPU、GPU的演進(jìn)歷程,AI專(zhuān)用芯片或引領(lǐng)未來(lái)計(jì)算平臺(tái)的新方向。正如愛(ài)因斯坦所說(shuō):\"想象力比知識(shí)更重要\" —— 在芯片設(shè)計(jì)領(lǐng)域,創(chuàng)新思維帶來(lái)的突破往往令人驚嘆。
    發(fā)表于 11-24 17:12

    GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)

    眾所周知,在大型模型訓(xùn)練中,通常采用每臺(tái)服務(wù)器配備多個(gè)GPU的集群架構(gòu)。在上一篇文章《高性能GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)(上篇)》中,我們對(duì)GPU網(wǎng)絡(luò)中的核心術(shù)語(yǔ)與概念進(jìn)行了詳盡介紹。本文
    的頭像 發(fā)表于 11-05 16:20 ?1213次閱讀
    <b class='flag-5'>GPU</b>服務(wù)器<b class='flag-5'>AI</b>網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)

    FPGA和ASIC在大模型推理加速中的應(yīng)用

    隨著現(xiàn)在AI的快速發(fā)展,使用FPGA和ASIC進(jìn)行推理加速的研究也越來(lái)越多,從目前的市場(chǎng)來(lái)說(shuō),有些公司已經(jīng)有了專(zhuān)門(mén)做推理的ASIC,像Groq的LPU,專(zhuān)門(mén)針對(duì)大語(yǔ)言模型的推理做了優(yōu)化,因此相比
    的頭像 發(fā)表于 10-29 14:12 ?1988次閱讀
    FPGA和<b class='flag-5'>ASIC</b>在大模型推理加速中的應(yīng)用

    為什么ai模型訓(xùn)練要用gpu

    GPU憑借其強(qiáng)大的并行處理能力和高效的內(nèi)存系統(tǒng),已成為AI模型訓(xùn)練不可或缺的重要工具。
    的頭像 發(fā)表于 10-24 09:39 ?954次閱讀

    英偉達(dá)或明年革新AI GPU設(shè)計(jì),采用插槽設(shè)計(jì)

    10月11日最新消息,集邦咨詢(xún)Trendforce于今日(10月11日)發(fā)表博文透露,英偉達(dá)預(yù)計(jì)在今年第四季度推出GB200后,正考慮在其下一代AI GPU產(chǎn)品中采納獨(dú)立GPU插槽設(shè)計(jì),以取代現(xiàn)有的板載解決方案。這一變動(dòng)預(yù)計(jì)將對(duì)
    的頭像 發(fā)表于 10-11 17:05 ?842次閱讀

    ai大模的應(yīng)用前景是什么?

    人工智能(AI)大模型的應(yīng)用前景非常廣泛,涉及到各個(gè)行業(yè)和領(lǐng)域。以下是對(duì)AI大模型應(yīng)用前景的介紹: 醫(yī)療健康領(lǐng)域 AI大模型在醫(yī)療健康領(lǐng)域的
    的頭像 發(fā)表于 07-16 10:13 ?1073次閱讀