chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Imagination性能高達600TOPS的終極AI加速器:耗時兩年 會給NVIDIA帶來多少挑戰(zhàn)?

工程師鄧生 ? 來源:雷鋒網(wǎng) ? 作者:包永剛 ? 2020-11-16 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

曾經(jīng)統(tǒng)治手機GPU IP市場的Imagination,歷經(jīng)變動之后,目前在移動GPU IP市場占有率有36%,汽車GPU IP市占率43%。近來,Imagination近期發(fā)布的一系列新品不僅是其實力的展現(xiàn),也足以讓同行們增加對這位老對手的關注。

11月13日,Imagination發(fā)布了耗時兩年研發(fā)的最新的第三代神經(jīng)網(wǎng)絡加速器(NNA)產(chǎn)品IMG Series4,其全新的多核架構(gòu)可提供600 TOPS(每秒萬億次操作)甚至更高的超高性能,主要面向先進駕駛輔助系統(tǒng)(ADAS)和自動駕駛應用。

以低功耗產(chǎn)品見長Imagination推出高性能的終極AI加速器,會給在自動駕駛汽車芯片市場占有領導地位的NVIDIA多大的沖擊?

耗時兩年打造的終極AI加速器

Imagination在AI火熱的2017年推出首代神經(jīng)網(wǎng)絡加速器(NNA)PowerVR 2NX,單核性能從1TOPS到4.1TOPS。緊接著,2018年PowerVR 3NX發(fā)布,單核性能從0.6TOPS到10TOPS,多核產(chǎn)品性能從20TOPS到160TOPS。

性能增強的同時,Imagination的NNA主要面向的市場也從2NX時的移動設備和汽車市場,進一步拓展到智能相機監(jiān)控、消費電子(尤其是數(shù)字電視)、低功耗IoT智能設備領域。

時隔兩年之后,Imagination才推出第三代NNA產(chǎn)品4NX。4NX系列的單核性能進一步提升,每個單核能以不到1瓦的功耗提供12.5TOPS的性能。相比前兩代NNA,新一代產(chǎn)品強調(diào)的是全新多核架構(gòu),這個新的多核架構(gòu)支持在多個內(nèi)核之間對工作負載進行靈活的分配和同步,從而實現(xiàn)更高性能。

Imagination Technologies產(chǎn)品管理部門總監(jiān)Gilberto Rodriguez介紹:“我們的軟件提供了精細的控制能力,并通過對多個工作負載進行批處理、拆分和調(diào)度而提高了靈活性,可以在任意數(shù)量的內(nèi)核上使用。Series4可為每個集群配置 2個、4個、6個或者8個內(nèi)核。1個8內(nèi)核的集群可以提供100TOPS的算力,配有6個8核集群的解決方案就可以提供600 TOPS的算力?!?/p>

據(jù)悉,在AI推理方面,Series4 NNA的性能比嵌入式GPU快20倍以上,比嵌入式CPU快1000倍。

至于為什么要推出如此高性能的AI加速器,Gilberto Rodriguez表示,“ADAS和自動駕駛對芯片有很高的算力需求,比如L2+的駕駛員檢測或語音/手勢控制需要10TOPS的性能,L3-L4級別的自動駕駛有50-100TOPS的性能需求,L5級別的自動駕駛性能需求超過500TOPS?!?/p>

“雖然市場上已經(jīng)有滿足自動駕駛需求的AI芯片,但功耗不夠理想。所以,我們花兩年時間去了解和評估客戶需求,基于我們的前兩代低功耗的產(chǎn)品,推出了高性能低功耗的4NX系列產(chǎn)品,并且將自動駕駛作為主打市場,也可以應用于數(shù)據(jù)中心和桌面級GPU?!?Imagination Technologies視覺和人工智能部門高級總監(jiān)Andrew Grant表示。

600TOPS的高性能如何兼顧低功耗?

需要指出的是,4NX系列的8內(nèi)核集群要實現(xiàn)100TOPS的性能,超過30 TOPS/Watt 的性能功耗比,以及超過12 TOPS/mm^2 的性能密度是要在5nm節(jié)點實現(xiàn)。

Gilberto Rodriguez也提到,如果要用多個集群實現(xiàn)更高算力,Imagination可以提供多集群的協(xié)同機制,但也需要客戶在應用層進行一些設計。

多核靈活架構(gòu)帶來的可擴展性讓4NX可以實現(xiàn)高性能,但對于高性能芯片而言,功耗的控制也非常關鍵,特別是AI芯片。AI芯片需要處理大量的數(shù)據(jù),并且數(shù)據(jù)的搬運耗費的功耗遠大于數(shù)據(jù)處理,因此,高性能AI芯片必須想辦法盡量減少數(shù)據(jù)的搬運,同時降低延遲和節(jié)省帶寬。

對于延遲的降低,Imagination采用的方法是單核組成2核、4核、6核或8核的多核集群中,所有內(nèi)核可以相互協(xié)作,并行處理一個任務,降低處理延遲,縮短響應時間。當然,集群中和多核既可以共同執(zhí)行一個批處理任務,也可以分別運行各自不同的網(wǎng)絡,也就是各個內(nèi)核能夠獨立運行。

核數(shù)的增加帶來性能提升的同時降低延遲

不同的核獨立運行

4NX更大的亮點在于其節(jié)省帶寬的Tensor Tiling( Imagination’s Tensor Tiling,ITT)技術,這是Imagination正在申請專利的技術,也是4系列中新增的功能。Tensor Tiling技術利用本地數(shù)據(jù)的依賴性將中間數(shù)據(jù)保存在片上存儲器中,最大限度地減少將數(shù)據(jù)傳輸至外部存儲器,相比上代產(chǎn)品,將帶寬降低多達90%。

具體而言,神經(jīng)網(wǎng)絡的多層以融合內(nèi)核的形式運行在加速器的硬件流水線里,融合內(nèi)核之間的特征圖(Feature Map)需要通過外部存儲進行交換。Tiling技術是充分利用緊耦合的 SRAM 來融合更多的層,更多的層被融合之后,就減少了需要通過外部存儲交換的特征圖,進而達到提升效率,節(jié)省帶寬的目的。

還需要說明一下Tensor Tiling技術中的批處理和拆分,批處理是分配適合批處理的大量的小型網(wǎng)絡任務到每個獨立工作的NNA單核,能夠提升并行處理能力。拆分則是任務在多個維度被拆分,所有NNA單核共同執(zhí)行一個推理任務,減少網(wǎng)絡推理延遲的同時,在理想情況下協(xié)同并行處理的吞吐量與獨立并發(fā)處理的相同,非常適合網(wǎng)絡層很大的網(wǎng)絡。

當然,Tensor Tiling的拆分是通過Imagination提供的編譯器來完成,不需要開發(fā)者手動完成,并且利用NNA的性能分析工具能夠?qū)I任務進行更好地調(diào)度和分配。

那Tensor Tiling在節(jié)省帶寬的同時能否減少數(shù)據(jù)的搬移?Gilberto Rodriguez表示,“答案是肯定的。一方面,Tensor Tiling讓待處理數(shù)據(jù)通過內(nèi)存帶寬的傳輸減少,另一方面,重復利用的神經(jīng)網(wǎng)絡權重給處理器核的傳輸次數(shù)也減少,這讓就可以有效減少數(shù)據(jù)搬運?!?/p>

硬件上層的工具鏈方面,Imagination的離線和在線工具組成的工作流程可以讓開發(fā)者更快實現(xiàn)部署。

NVIDIA在自動駕駛領域?qū)⒂瓉硇聦κ郑?/p>

NVIDIA在2015年就推出了車載計算平臺,此后持續(xù)迭代,目前在自動駕駛芯片市場已經(jīng)處于優(yōu)勢地位。不過,擅長桌面級GPU的NVIDIA能夠提供高性能,但功耗可能對于電池供電的電動汽車不夠友好。這也是在對功耗要求比較嚴格的移動端有優(yōu)勢的Imagination的機會所在。

與NVIDIA有所不同,Imagination是IP提供商,并不會直接提供芯片。因此,Imagination可以與領先的汽車行業(yè)顛覆者、一級供應商、整車廠(OEM)和汽車系統(tǒng)級芯片(SoC)廠商合作,推出有競爭力的產(chǎn)品。為了幫助合作伙伴更好進入這一市場更快推出車規(guī)級產(chǎn)品,此次推出的NX4還包含IP級別的安全功能且設計流程符合ISO 26262標準。ISO 26262是旨在解決汽車電子產(chǎn)品風險的行業(yè)安全標準。

新推出的4系列NNA可以在不影響性能的情況下,安全地進行神經(jīng)網(wǎng)絡推理。硬件安全機制可以保護編譯后的網(wǎng)絡、網(wǎng)絡的執(zhí)行和數(shù)據(jù)處理管道。

Andrew Grant透露,已經(jīng)開始提供授權,并將于2020年12月在市場上全面供應。授權的客戶目前已經(jīng)不止一家。

這就意味著,自動駕駛芯片市場將會迎來更多有競爭力的產(chǎn)品。雷鋒網(wǎng)認為,Imagination更強的GPU和NNA產(chǎn)品組合將會幫助更多想要進入這一市場的公司推出更有競爭力的產(chǎn)品。上個月,Imagination發(fā)布了最新一代的IMG B系列高性能GPU IP,這款多核架構(gòu)GPU IP 4個系列內(nèi)核有33種配置。

更通用的GPU和更專用的AI加速器,顯然可以給高性能計算帶來更多的選擇。有意思的是,NVIDIA目前也擁有性能強勁的GPU和AI加速Tensor Core的組合。

ABI Research預計,到2027年左右,對ADAS的需求將增長兩倍,但汽車行業(yè)已然將目光投向了更遠的全自動駕駛汽車和自動駕駛出租車,從L2和L3級ADAS向L4和L5級全自動駕駛演進的過程中,高性能、低延遲和高能效的結(jié)合將是關鍵所在。

巨大的市場機會之下,兩家芯片產(chǎn)品優(yōu)勢類似的公司,會如何競爭?

責任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5496

    瀏覽量

    109107
  • imagination
    +關注

    關注

    1

    文章

    617

    瀏覽量

    63099
  • AI加速器
    +關注

    關注

    1

    文章

    73

    瀏覽量

    9434
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數(shù)據(jù)生成。借助 NVID
    的頭像 發(fā)表于 12-01 09:25 ?510次閱讀

    邊緣計算中的AI加速器類型與應用

    提升AI應用的性能。在邊緣計算中,有多種類型的AI加速器,各自具有不同的優(yōu)勢、局限性和適用場景。AI加速
    的頭像 發(fā)表于 11-06 13:42 ?431次閱讀
    邊緣計算中的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>類型與應用

    亞馬遜云科技第三期創(chuàng)業(yè)加速器圓滿收官 助力初創(chuàng)釋放Agentic AI潛力 加速全球化進程

    北京——202510月28日 ,亞馬遜云科技第三期創(chuàng)業(yè)加速器項目圓滿收官。35家入營企業(yè)齊聚一堂,分享了各自的業(yè)務發(fā)展情況,以及參與本期加速器的收獲及體驗。第三期創(chuàng)業(yè)加速器持續(xù)聚焦
    的頭像 發(fā)表于 10-29 15:18 ?747次閱讀

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    260 針金手指設計 :機械上與 Jetson Nano 載板 100% 兼容,可重復使用現(xiàn)有硬件投資。 PCIe 3.0 x4高速通道 :支持外部AI加速器(例如TensorRT加速器)。 3.
    發(fā)表于 10-11 09:08

    Cadence 借助 NVIDIA DGX SuperPOD 模型擴展數(shù)字孿生平臺庫,加速 AI 數(shù)據(jù)中心部署與運營

    人員將能夠在 AI 工廠的構(gòu)建中輕松部署世界領先的 AI 加速器。作為一款創(chuàng)新解決方案,Cadence Reality Digital Twin Platform 能夠在物理實施之前,根據(jù)特定服務等級協(xié)議對
    的頭像 發(fā)表于 09-15 15:19 ?1256次閱讀

    榮獲大獎項,Imagination新一代GPU引領端側(cè)AI新時代

    “2025半導體市場創(chuàng)新表現(xiàn)獎”評選也正式揭曉,Imagination分別榮獲“年度AI市場領軍企業(yè)獎”與“年度優(yōu)秀AIIP獎”項大獎。E-SeriesGPU引領端
    的頭像 發(fā)表于 08-28 11:26 ?1130次閱讀
    榮獲<b class='flag-5'>兩</b>大獎項,<b class='flag-5'>Imagination</b>新一代GPU引領端側(cè)<b class='flag-5'>AI</b>新時代

    面向半定制AI基礎架構(gòu)的NVIDIA NVLink Fusion技術

    為了高效應對 AI 工作負載,數(shù)據(jù)中心正在被重構(gòu)。這是一項非常復雜的工作,因此,NVIDIA 目前正在交付以 NVIDIA 機架級架構(gòu)為單位的 AI 工廠。為了讓
    的頭像 發(fā)表于 06-06 14:59 ?1094次閱讀
    面向半定制<b class='flag-5'>AI</b>基礎架構(gòu)的<b class='flag-5'>NVIDIA</b> NVLink Fusion技術

    樹莓派 AI HAT+ !到手了!我來教你安裝!

    Hailo-8L和Hailo-8神經(jīng)網(wǎng)絡推理加速器,提供13和26太赫茲/秒(TOPS種型號。13TOPS變體最適合處理中等工作量,性能
    的頭像 發(fā)表于 03-25 09:39 ?1087次閱讀
    樹莓派 <b class='flag-5'>AI</b> HAT+ !到手了!我來教你安裝!

    Cadence 利用 NVIDIA Grace Blackwell 加速AI驅(qū)動的工程設計和科學應用

    融合設計專業(yè)知識與加速計算,推動科技創(chuàng)新、實現(xiàn)能效和工程生產(chǎn)力方面的突破性進展,引領全球生活新范式 內(nèi)容提要 ●?Cadence 借助 NVIDIA 最新 Blackwell 系統(tǒng),將求解的速度
    的頭像 發(fā)表于 03-24 10:14 ?1220次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle 數(shù)據(jù)庫與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI ? ? ? 美國加利福尼亞州圣何塞 —— GTC? —— 2025 3 月 18 日
    發(fā)表于 03-19 15:24 ?470次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理

    嵌入式AI加速器DRP-AI 詳細介紹

    的嵌入式設備。此外,人工智能正在不斷發(fā)展,新的算法不時被開發(fā)出來。 在人工智能快速發(fā)展的過程中,瑞薩開發(fā)了人工智能加速器(DRP-AI)和軟件(DRP-AI翻譯),既提供高
    的頭像 發(fā)表于 03-15 16:13 ?1528次閱讀
    嵌入式<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>DRP-<b class='flag-5'>AI</b> 詳細介紹

    開源鴻蒙版AI終端主板AIoT-3588A彩頁

    AIoT-3588A是一款開源鴻蒙版AI終端主板,基于RK3588八核處理,內(nèi)置高達6TOPS算力AI
    發(fā)表于 02-28 13:58 ?2次下載

    從圖形處理到AI加速,一文看懂Imagination D系列GPU

    Imagination的D系列于2022首次發(fā)布,見證了生成式AI從云端到智能手機等消費設備中普及。在云端,由于GPU的可編程性、可擴展性和快速處理AI工作負載的能力,GPU已成為高
    的頭像 發(fā)表于 02-27 08:33 ?829次閱讀
    從圖形處理到<b class='flag-5'>AI</b><b class='flag-5'>加速</b>,一文看懂<b class='flag-5'>Imagination</b> D系列GPU

    Imagination DXTP GPU IP:加速游戲 AI應用,全天候暢玩無阻

    Imagination推出了最新產(chǎn)品——ImaginationDXTPGPUIP,在智能手機和其他功耗受限設備上加速圖形和AI工作負載時,保證全天候的電池續(xù)航。它是我們最新D系列GPU的最終產(chǎn)品
    的頭像 發(fā)表于 02-26 08:32 ?685次閱讀
    <b class='flag-5'>Imagination</b> DXTP GPU IP:<b class='flag-5'>加速</b>游戲 <b class='flag-5'>AI</b>應用,全天候暢玩無阻

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司發(fā)布了備受矚目的Janus Pro模型,其憑借超強性能和高精度在業(yè)界引發(fā)了廣泛關注。為了進一步提升該模型的應用效能,英特爾宣布其Gaudi 2D AI加速器已針對Janus
    的頭像 發(fā)表于 02-10 11:10 ?929次閱讀