chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Imagination性能高達(dá)600TOPS的終極AI加速器:耗時(shí)兩年 會(huì)給NVIDIA帶來(lái)多少挑戰(zhàn)?

工程師鄧生 ? 來(lái)源:雷鋒網(wǎng) ? 作者:包永剛 ? 2020-11-16 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

曾經(jīng)統(tǒng)治手機(jī)GPU IP市場(chǎng)的Imagination,歷經(jīng)變動(dòng)之后,目前在移動(dòng)GPU IP市場(chǎng)占有率有36%,汽車GPU IP市占率43%。近來(lái),Imagination近期發(fā)布的一系列新品不僅是其實(shí)力的展現(xiàn),也足以讓同行們?cè)黾訉?duì)這位老對(duì)手的關(guān)注。

11月13日,Imagination發(fā)布了耗時(shí)兩年研發(fā)的最新的第三代神經(jīng)網(wǎng)絡(luò)加速器(NNA)產(chǎn)品IMG Series4,其全新的多核架構(gòu)可提供600 TOPS(每秒萬(wàn)億次操作)甚至更高的超高性能,主要面向先進(jìn)駕駛輔助系統(tǒng)(ADAS)和自動(dòng)駕駛應(yīng)用。

以低功耗產(chǎn)品見(jiàn)長(zhǎng)Imagination推出高性能的終極AI加速器,會(huì)給在自動(dòng)駕駛汽車芯片市場(chǎng)占有領(lǐng)導(dǎo)地位的NVIDIA多大的沖擊?

耗時(shí)兩年打造的終極AI加速器

Imagination在AI火熱的2017年推出首代神經(jīng)網(wǎng)絡(luò)加速器(NNA)PowerVR 2NX,單核性能從1TOPS到4.1TOPS。緊接著,2018年P(guān)owerVR 3NX發(fā)布,單核性能從0.6TOPS到10TOPS,多核產(chǎn)品性能從20TOPS到160TOPS。

性能增強(qiáng)的同時(shí),Imagination的NNA主要面向的市場(chǎng)也從2NX時(shí)的移動(dòng)設(shè)備和汽車市場(chǎng),進(jìn)一步拓展到智能相機(jī)監(jiān)控、消費(fèi)電子(尤其是數(shù)字電視)、低功耗IoT智能設(shè)備領(lǐng)域。

時(shí)隔兩年之后,Imagination才推出第三代NNA產(chǎn)品4NX。4NX系列的單核性能進(jìn)一步提升,每個(gè)單核能以不到1瓦的功耗提供12.5TOPS的性能。相比前兩代NNA,新一代產(chǎn)品強(qiáng)調(diào)的是全新多核架構(gòu),這個(gè)新的多核架構(gòu)支持在多個(gè)內(nèi)核之間對(duì)工作負(fù)載進(jìn)行靈活的分配和同步,從而實(shí)現(xiàn)更高性能。

Imagination Technologies產(chǎn)品管理部門總監(jiān)Gilberto Rodriguez介紹:“我們的軟件提供了精細(xì)的控制能力,并通過(guò)對(duì)多個(gè)工作負(fù)載進(jìn)行批處理、拆分和調(diào)度而提高了靈活性,可以在任意數(shù)量的內(nèi)核上使用。Series4可為每個(gè)集群配置 2個(gè)、4個(gè)、6個(gè)或者8個(gè)內(nèi)核。1個(gè)8內(nèi)核的集群可以提供100TOPS的算力,配有6個(gè)8核集群的解決方案就可以提供600 TOPS的算力?!?/p>

據(jù)悉,在AI推理方面,Series4 NNA的性能比嵌入式GPU快20倍以上,比嵌入式CPU快1000倍。

至于為什么要推出如此高性能的AI加速器,Gilberto Rodriguez表示,“ADAS和自動(dòng)駕駛對(duì)芯片有很高的算力需求,比如L2+的駕駛員檢測(cè)或語(yǔ)音/手勢(shì)控制需要10TOPS的性能,L3-L4級(jí)別的自動(dòng)駕駛有50-100TOPS的性能需求,L5級(jí)別的自動(dòng)駕駛性能需求超過(guò)500TOPS。”

“雖然市場(chǎng)上已經(jīng)有滿足自動(dòng)駕駛需求的AI芯片,但功耗不夠理想。所以,我們花兩年時(shí)間去了解和評(píng)估客戶需求,基于我們的前兩代低功耗的產(chǎn)品,推出了高性能低功耗的4NX系列產(chǎn)品,并且將自動(dòng)駕駛作為主打市場(chǎng),也可以應(yīng)用于數(shù)據(jù)中心和桌面級(jí)GPU?!?Imagination Technologies視覺(jué)和人工智能部門高級(jí)總監(jiān)Andrew Grant表示。

600TOPS的高性能如何兼顧低功耗?

需要指出的是,4NX系列的8內(nèi)核集群要實(shí)現(xiàn)100TOPS的性能,超過(guò)30 TOPS/Watt 的性能功耗比,以及超過(guò)12 TOPS/mm^2 的性能密度是要在5nm節(jié)點(diǎn)實(shí)現(xiàn)。

Gilberto Rodriguez也提到,如果要用多個(gè)集群實(shí)現(xiàn)更高算力,Imagination可以提供多集群的協(xié)同機(jī)制,但也需要客戶在應(yīng)用層進(jìn)行一些設(shè)計(jì)。

多核靈活架構(gòu)帶來(lái)的可擴(kuò)展性讓4NX可以實(shí)現(xiàn)高性能,但對(duì)于高性能芯片而言,功耗的控制也非常關(guān)鍵,特別是AI芯片。AI芯片需要處理大量的數(shù)據(jù),并且數(shù)據(jù)的搬運(yùn)耗費(fèi)的功耗遠(yuǎn)大于數(shù)據(jù)處理,因此,高性能AI芯片必須想辦法盡量減少數(shù)據(jù)的搬運(yùn),同時(shí)降低延遲和節(jié)省帶寬。

對(duì)于延遲的降低,Imagination采用的方法是單核組成2核、4核、6核或8核的多核集群中,所有內(nèi)核可以相互協(xié)作,并行處理一個(gè)任務(wù),降低處理延遲,縮短響應(yīng)時(shí)間。當(dāng)然,集群中和多核既可以共同執(zhí)行一個(gè)批處理任務(wù),也可以分別運(yùn)行各自不同的網(wǎng)絡(luò),也就是各個(gè)內(nèi)核能夠獨(dú)立運(yùn)行。

核數(shù)的增加帶來(lái)性能提升的同時(shí)降低延遲

不同的核獨(dú)立運(yùn)行

4NX更大的亮點(diǎn)在于其節(jié)省帶寬的Tensor Tiling( Imagination’s Tensor Tiling,ITT)技術(shù),這是Imagination正在申請(qǐng)專利的技術(shù),也是4系列中新增的功能。Tensor Tiling技術(shù)利用本地?cái)?shù)據(jù)的依賴性將中間數(shù)據(jù)保存在片上存儲(chǔ)器中,最大限度地減少將數(shù)據(jù)傳輸至外部存儲(chǔ)器,相比上代產(chǎn)品,將帶寬降低多達(dá)90%。

具體而言,神經(jīng)網(wǎng)絡(luò)的多層以融合內(nèi)核的形式運(yùn)行在加速器的硬件流水線里,融合內(nèi)核之間的特征圖(Feature Map)需要通過(guò)外部存儲(chǔ)進(jìn)行交換。Tiling技術(shù)是充分利用緊耦合的 SRAM 來(lái)融合更多的層,更多的層被融合之后,就減少了需要通過(guò)外部存儲(chǔ)交換的特征圖,進(jìn)而達(dá)到提升效率,節(jié)省帶寬的目的。

還需要說(shuō)明一下Tensor Tiling技術(shù)中的批處理和拆分,批處理是分配適合批處理的大量的小型網(wǎng)絡(luò)任務(wù)到每個(gè)獨(dú)立工作的NNA單核,能夠提升并行處理能力。拆分則是任務(wù)在多個(gè)維度被拆分,所有NNA單核共同執(zhí)行一個(gè)推理任務(wù),減少網(wǎng)絡(luò)推理延遲的同時(shí),在理想情況下協(xié)同并行處理的吞吐量與獨(dú)立并發(fā)處理的相同,非常適合網(wǎng)絡(luò)層很大的網(wǎng)絡(luò)。

當(dāng)然,Tensor Tiling的拆分是通過(guò)Imagination提供的編譯器來(lái)完成,不需要開(kāi)發(fā)者手動(dòng)完成,并且利用NNA的性能分析工具能夠?qū)I任務(wù)進(jìn)行更好地調(diào)度和分配。

那Tensor Tiling在節(jié)省帶寬的同時(shí)能否減少數(shù)據(jù)的搬移?Gilberto Rodriguez表示,“答案是肯定的。一方面,Tensor Tiling讓待處理數(shù)據(jù)通過(guò)內(nèi)存帶寬的傳輸減少,另一方面,重復(fù)利用的神經(jīng)網(wǎng)絡(luò)權(quán)重給處理器核的傳輸次數(shù)也減少,這讓就可以有效減少數(shù)據(jù)搬運(yùn)?!?/p>

硬件上層的工具鏈方面,Imagination的離線和在線工具組成的工作流程可以讓開(kāi)發(fā)者更快實(shí)現(xiàn)部署。

NVIDIA在自動(dòng)駕駛領(lǐng)域?qū)⒂瓉?lái)新對(duì)手?

NVIDIA在2015年就推出了車載計(jì)算平臺(tái),此后持續(xù)迭代,目前在自動(dòng)駕駛芯片市場(chǎng)已經(jīng)處于優(yōu)勢(shì)地位。不過(guò),擅長(zhǎng)桌面級(jí)GPU的NVIDIA能夠提供高性能,但功耗可能對(duì)于電池供電的電動(dòng)汽車不夠友好。這也是在對(duì)功耗要求比較嚴(yán)格的移動(dòng)端有優(yōu)勢(shì)的Imagination的機(jī)會(huì)所在。

與NVIDIA有所不同,Imagination是IP提供商,并不會(huì)直接提供芯片。因此,Imagination可以與領(lǐng)先的汽車行業(yè)顛覆者、一級(jí)供應(yīng)商、整車廠(OEM)和汽車系統(tǒng)級(jí)芯片(SoC)廠商合作,推出有競(jìng)爭(zhēng)力的產(chǎn)品。為了幫助合作伙伴更好進(jìn)入這一市場(chǎng)更快推出車規(guī)級(jí)產(chǎn)品,此次推出的NX4還包含IP級(jí)別的安全功能且設(shè)計(jì)流程符合ISO 26262標(biāo)準(zhǔn)。ISO 26262是旨在解決汽車電子產(chǎn)品風(fēng)險(xiǎn)的行業(yè)安全標(biāo)準(zhǔn)。

新推出的4系列NNA可以在不影響性能的情況下,安全地進(jìn)行神經(jīng)網(wǎng)絡(luò)推理。硬件安全機(jī)制可以保護(hù)編譯后的網(wǎng)絡(luò)、網(wǎng)絡(luò)的執(zhí)行和數(shù)據(jù)處理管道。

Andrew Grant透露,已經(jīng)開(kāi)始提供授權(quán),并將于2020年12月在市場(chǎng)上全面供應(yīng)。授權(quán)的客戶目前已經(jīng)不止一家。

這就意味著,自動(dòng)駕駛芯片市場(chǎng)將會(huì)迎來(lái)更多有競(jìng)爭(zhēng)力的產(chǎn)品。雷鋒網(wǎng)認(rèn)為,Imagination更強(qiáng)的GPU和NNA產(chǎn)品組合將會(huì)幫助更多想要進(jìn)入這一市場(chǎng)的公司推出更有競(jìng)爭(zhēng)力的產(chǎn)品。上個(gè)月,Imagination發(fā)布了最新一代的IMG B系列高性能GPU IP,這款多核架構(gòu)GPU IP 4個(gè)系列內(nèi)核有33種配置。

更通用的GPU和更專用的AI加速器,顯然可以給高性能計(jì)算帶來(lái)更多的選擇。有意思的是,NVIDIA目前也擁有性能強(qiáng)勁的GPU和AI加速Tensor Core的組合。

ABI Research預(yù)計(jì),到2027年左右,對(duì)ADAS的需求將增長(zhǎng)兩倍,但汽車行業(yè)已然將目光投向了更遠(yuǎn)的全自動(dòng)駕駛汽車和自動(dòng)駕駛出租車,從L2和L3級(jí)ADAS向L4和L5級(jí)全自動(dòng)駕駛演進(jìn)的過(guò)程中,高性能、低延遲和高能效的結(jié)合將是關(guān)鍵所在。

巨大的市場(chǎng)機(jī)會(huì)之下,兩家芯片產(chǎn)品優(yōu)勢(shì)類似的公司,會(huì)如何競(jìng)爭(zhēng)?

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5299

    瀏覽量

    106292
  • imagination
    +關(guān)注

    關(guān)注

    1

    文章

    599

    瀏覽量

    62198
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    70

    瀏覽量

    9082
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    面向半定制AI基礎(chǔ)架構(gòu)的NVIDIA NVLink Fusion技術(shù)

    為了高效應(yīng)對(duì) AI 工作負(fù)載,數(shù)據(jù)中心正在被重構(gòu)。這是一項(xiàng)非常復(fù)雜的工作,因此,NVIDIA 目前正在交付以 NVIDIA 機(jī)架級(jí)架構(gòu)為單位的 AI 工廠。為了讓
    的頭像 發(fā)表于 06-06 14:59 ?486次閱讀
    面向半定制<b class='flag-5'>AI</b>基礎(chǔ)架構(gòu)的<b class='flag-5'>NVIDIA</b> NVLink Fusion技術(shù)

    樹莓派 AI HAT+ !到手了!我來(lái)教你安裝!

    Hailo-8L和Hailo-8神經(jīng)網(wǎng)絡(luò)推理加速器,提供13和26太赫茲/秒(TOPS種型號(hào)。13TOPS變體最適合處理中等工作量,性能
    的頭像 發(fā)表于 03-25 09:39 ?541次閱讀
    樹莓派 <b class='flag-5'>AI</b> HAT+ !到手了!我來(lái)教你安裝!

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle 數(shù)據(jù)庫(kù)與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI ? ? ? 美國(guó)加利福尼亞州圣何塞 —— GTC? —— 2025 3 月 18 日
    發(fā)表于 03-19 15:24 ?353次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理

    從圖形處理到AI加速,一文看懂Imagination D系列GPU

    Imagination的D系列于2022首次發(fā)布,見(jiàn)證了生成式AI從云端到智能手機(jī)等消費(fèi)設(shè)備中普及。在云端,由于GPU的可編程性、可擴(kuò)展性和快速處理AI工作負(fù)載的能力,GPU已成為高
    的頭像 發(fā)表于 02-27 08:33 ?476次閱讀
    從圖形處理到<b class='flag-5'>AI</b><b class='flag-5'>加速</b>,一文看懂<b class='flag-5'>Imagination</b> D系列GPU

    Imagination DXTP GPU IP:加速游戲 AI應(yīng)用,全天候暢玩無(wú)阻

    Imagination推出了最新產(chǎn)品——ImaginationDXTPGPUIP,在智能手機(jī)和其他功耗受限設(shè)備上加速圖形和AI工作負(fù)載時(shí),保證全天候的電池續(xù)航。它是我們最新D系列GPU的最終產(chǎn)品
    的頭像 發(fā)表于 02-26 08:32 ?433次閱讀
    <b class='flag-5'>Imagination</b> DXTP GPU IP:<b class='flag-5'>加速</b>游戲 <b class='flag-5'>AI</b>應(yīng)用,全天候暢玩無(wú)阻

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司發(fā)布了備受矚目的Janus Pro模型,其憑借超強(qiáng)性能和高精度在業(yè)界引發(fā)了廣泛關(guān)注。為了進(jìn)一步提升該模型的應(yīng)用效能,英特爾宣布其Gaudi 2D AI加速器已針對(duì)Janus
    的頭像 發(fā)表于 02-10 11:10 ?615次閱讀

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    對(duì)卷積核優(yōu)化的思考。 GPU的存儲(chǔ)體系采用了獨(dú)特的倒金字塔結(jié)構(gòu),在我看來(lái)這是其計(jì)算性能的關(guān)鍵。大容量寄存設(shè)計(jì)破解了傳統(tǒng)馮諾依曼架構(gòu)的內(nèi)存瓶頸,合并訪存機(jī)制巧妙解決了內(nèi)存帶寬限制。NVIDIA GPU
    發(fā)表于 11-24 17:12

    IBM與AMD攜手部署MI300X加速器,強(qiáng)化AI與HPC能力

    舉措預(yù)計(jì)將于2025上半年正式推出。 此次合作的核心目標(biāo)是提升通用人工智能(AI)模型的性能與能效,并為企業(yè)客戶提供高性能計(jì)算(HPC)應(yīng)用的強(qiáng)大支持。AMD的Instinct MI
    的頭像 發(fā)表于 11-21 11:07 ?718次閱讀

    IBM將在云平臺(tái)部署AMD加速器

    IBM與AMD近期宣布了一項(xiàng)重要合作協(xié)議,根據(jù)協(xié)議,IBM將在其云平臺(tái)上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業(yè)客戶在生成式AI模型方面的性能和能效,進(jìn)一步推動(dòng)A
    的頭像 發(fā)表于 11-19 16:24 ?594次閱讀

    NVIDIA加速AI在日本各行各業(yè)的應(yīng)用

    企業(yè)借助基于 NVIDIA AI Enterprise 與 Omniverse 工業(yè) AI 構(gòu)建的創(chuàng)新中心和服務(wù)加速 AI 轉(zhuǎn)型。
    的頭像 發(fā)表于 11-19 15:45 ?757次閱讀

    日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

    日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)和 NVIDIA Isaac 加速 AI 創(chuàng)新。
    的頭像 發(fā)表于 11-19 14:34 ?925次閱讀

    樹莓派新推AI HAT+:26 TOPS性能版本震撼登場(chǎng)

    供了兩種性能配置供用戶選擇。其中,基礎(chǔ)版配備了Hailo-8L加速器,性能達(dá)到13 TOPS(每秒萬(wàn)億次操作),售價(jià)為70美元;而更為強(qiáng)大的高端版本則采用了Hailo-8
    的頭像 發(fā)表于 11-07 13:44 ?1285次閱讀

    超緊湊模塊提供高達(dá) 39 TOPS AI 算力

    的 XDNA? NPU 和強(qiáng)大的 Radeon RDNA 3? 圖形處理,可為AI推理提供高達(dá)39 TOPS的驚人算力。 ? ?? 這使得全新conga-TCR8 Type 6模塊在
    發(fā)表于 09-25 13:46 ?1548次閱讀
     超緊湊模塊提供<b class='flag-5'>高達(dá)</b> 39 <b class='flag-5'>TOPS</b> <b class='flag-5'>AI</b> 算力

    SiFive發(fā)布MX系列高性能AI加速器IP

    AI技術(shù)日新月異的今天,RISC-V IP設(shè)計(jì)領(lǐng)域的領(lǐng)軍企業(yè)SiFive再次引領(lǐng)行業(yè)潮流,正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。這
    的頭像 發(fā)表于 09-24 14:46 ?806次閱讀