chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI處理器熱潮正在退去

我快閉嘴 ? 來源:EETOP ? 作者:EETOP ? 2020-09-02 14:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

俗語說得好:海水退潮之后,才知道誰沒穿褲子。但歷史的教訓(xùn)往往證明殘酷的事實(shí):結(jié)果站在浪里的所有人,全部都沒有穿褲子。

處理器業(yè)界的年度盛事第32屆IEEE HotChips,剛剛在今年8月以全部線上活動(dòng)型式結(jié)束了,連擠4年牙膏的IBM與英特爾總算換了一管全新牙膏,真是可喜可賀。

但另一方面,分別在云端服務(wù)和終端硬件執(zhí)人工智能牛耳的Google與nVidia,卻也學(xué)到了“擠牙膏”的精髓,前者讓2018年就問世的第三代TPU,從2018年Google I/O講到2020 HotChips,后者在HotChips發(fā)表的內(nèi)容,完全承襲GTC 2000的簡報(bào),唯一差別只有把華為Ascend 910人工智能處理器和英特爾支援BF16格式的“新型Xeon”Cooper Lake-P拖出來狠狠打一頓。

總之,我們來瞧瞧HotChips 32 的Google 第三代TPU 與nVidiaA100。

講了三年總算勉強(qiáng)講完的Google TPU v3

Google 這家公司最令人稱許之處,在于恐怖的“前瞻執(zhí)行力”,每當(dāng)眾人還在清談“技術(shù)趨勢(shì)”之際,就突然石破天驚的昭示天下:你們還在嘴炮的東西,我們?cè)缇蛻?yīng)用到實(shí)際產(chǎn)品。諸多豐功偉業(yè)的最知名案例,莫過于2013 年底,Google 爆炸性公開“規(guī)劃部署已達(dá)3 年”的B4 數(shù)據(jù)中心廣域網(wǎng)絡(luò),開大規(guī)模商業(yè)化軟件定義網(wǎng)絡(luò)(SDN)之先河。

早在2015年就投入內(nèi)部應(yīng)用的Google TPU,更是近年來的經(jīng)典案例,接著Google也很迅速推陳出新,2017年推出深度學(xué)習(xí)第二代TPU,第三代TPU更早在2018 Google I/O就亮相了。

但Google 也隨即“擠牙膏之神”上身,2019 年HotChips 31 教程僅提到部分資訊,到2020 年才公開細(xì)節(jié)全貌。

我們都有充分的理由相信,第四甚至第五代TPU,不是早就上線服役也該早在路上了。

2019 年比較對(duì)手是nVidia V100,結(jié)果2020 年看不到第四代TPU 較量V100,讓人感覺有點(diǎn)奇怪。

TPU v3 概觀可視為TPU v2 的雙倍放大版,散熱系統(tǒng)從氣冷改為液冷,也是主機(jī)板最顯眼的特色。

TPU v3 仍舊著重持續(xù)提升存儲(chǔ)器帶寬(+30%)與容量(加倍),拜液冷之賜,時(shí)鐘頻率也有成長(+30%)。

TPU v3 的指令集架構(gòu)是332 位元長的超長指令集(VLIW),VLIW 指令包內(nèi)總計(jì)有2 個(gè)純量指令、4 個(gè)向量指令(其中2 個(gè)是存儲(chǔ)器載入/回存)、 2 個(gè)矩陣(Matrix)指令、6 個(gè)立即值(Immediate)與一個(gè)雜項(xiàng)(Misc)應(yīng)用。

強(qiáng)化多芯片互連總線,打造更大規(guī)模的“人工智能超級(jí)電腦”,更是TPU v3 的重頭戲,也就是上圖那個(gè)“4x Nodes”。

同樣一片系統(tǒng)主機(jī)板裝4 顆TPU,TPU v3 組成的“人工智能超級(jí)電腦”,擁有前代8 倍以上效能、8 倍存儲(chǔ)器容量、4 倍芯片數(shù)量與4 倍的最大裝置設(shè)定數(shù),可切割成256 個(gè)獨(dú)立運(yùn)算平臺(tái)分租給客戶。

順便一提,現(xiàn)今已知關(guān)于Google TPU 的專利多達(dá)50 份,亦不乏詳細(xì)描述第三代TPU 的內(nèi)部架構(gòu)細(xì)節(jié),也是眾多有志進(jìn)軍人工智能芯片的冒險(xiǎn)者,抽絲剝繭的研究對(duì)象。

但這對(duì)使用Google Cloud AI 的用戶,甚至大多數(shù)Google 部門來說,其實(shí)并不重要,他們只要用得爽快、不需要“為了喝牛奶自己蓋一座牧場(chǎng)”就夠了。

GPU 基本盤穩(wěn)扎穩(wěn)打的nVidia A100

nVidia以通用GPU為基礎(chǔ),站穩(wěn)高效能運(yùn)算市場(chǎng),并將觸角逐漸延伸到人工智能和自駕車輛等新興應(yīng)用領(lǐng)域,使2020年夏天市值連續(xù)超越英特爾和三星,證實(shí)外界多么看好“皮衣教主”昭示天下的“美好未來”。無論個(gè)人電腦與高效能運(yùn)算領(lǐng)域,從“電競(jìng)筆電非有Max-Q不可”現(xiàn)象到超級(jí)電腦Top500清單滿滿的nVidia GPU,優(yōu)勢(shì)地位看似牢不可破。

nVidia 旗艦GPU 也隨著制程演進(jìn)而持續(xù)“恐龍化”,Ampere 世代之首A100 是一顆臺(tái)積電7 納米制程、540 億晶體管的巨獸,像更多執(zhí)行單元、更大存儲(chǔ)器子系統(tǒng)帶寬、一直更新的DGX 超級(jí)電腦等,是各位也都耳熟能詳,甚至早就令人哈欠連連的“標(biāo)準(zhǔn)劇情”了。

關(guān)于人工智能應(yīng)用,nVidia A100 最重要的特色,莫過于自行定義的TF32(Tensor Float 32)浮點(diǎn)數(shù)格式。講白了就是“取長補(bǔ)短”,既然Google BF16 犧牲掉FP32 的精度,維持動(dòng)態(tài)范圍不變,那就讓精度和FP16 一樣吧,神奇的19 位元長度TF32就這樣誕生了,兼具FP32的動(dòng)態(tài)范圍和FP16 的精度。nVidia 之所以這樣大費(fèi)周章創(chuàng)造新格式,根本目的不外乎要降低存儲(chǔ)器帶寬和容量需求,和Google發(fā)明BF16 如出一轍。

理所當(dāng)然的,TF32 在A100 一定跑得很快,因所需帶寬僅為前代V100 一半或三分之一,更能喂飽嗷嗷待哺的龐大Tensor Core。

但這件事的背后,隱隱約約透露nVidia長期領(lǐng)先AMD(ATI)的根本原因與基本思維:存儲(chǔ)器帶寬,這件事早從2004年NV40(GeForce 6系列)存儲(chǔ)器控制器內(nèi)建壓縮傳輸機(jī)能,相關(guān)技術(shù)持續(xù)演進(jìn)并陸續(xù)申請(qǐng)專利,就已埋下了種子。過去十幾年來,AMD或ATI的GPU,需要更多存儲(chǔ)器帶寬,才能實(shí)現(xiàn)同等級(jí)的效能水準(zhǔn),絕對(duì)不是偶然。

大概整批帶槍投靠英特爾的前AMD 團(tuán)隊(duì)過去吃了不少悶虧,這次替英特爾重新打造Xe 繪圖架構(gòu)時(shí),也很刻意提到“End-To-End Compression”,只是不知道會(huì)不會(huì)不小心踩到nVidia 的專利地雷。

當(dāng)GPU 踏入高效能運(yùn)算和人工智能,“每筆運(yùn)算可平均分配到的存儲(chǔ)器帶寬,持續(xù)穩(wěn)定的下滑中”,更讓提高運(yùn)算效能這件事,絕非區(qū)區(qū)增加幾個(gè)特化指令與擴(kuò)張執(zhí)行單元,即可迎刃而解,更需搞定帶寬這件事,一旦帶寬不足,就發(fā)揮不出完整的運(yùn)算效能。

聽說nVidia 下一代GPU“Hopper”將改弦易轍,改走多芯片Chiplet“包水餃”路線,也許nVidia 在多芯片連結(jié)架構(gòu)部分,將帶來讓人感到驚奇的技術(shù)突破也說不定,讓人對(duì)明年HotChips 33 多抱持一分期待。

人工智能熱潮的消退:先講求不要餓死再求發(fā)展

話說回來,我們就不得不探究一個(gè)大哉問:為何越來越多芯片廠商開始“擠牙膏”?要么不是受摩爾第二定律詛咒,產(chǎn)品技術(shù)難以短期內(nèi)飛躍性提升,要么就是講再多對(duì)我也沒任何實(shí)質(zhì)好處,還不如少講一點(diǎn)悶聲發(fā)大財(cái)。

不過這幾年,難道人工智能芯片不是很火的話題嗎?2017年HotChips 29,不就是從主題演講到議程,從泛用處理器、GPU、ASIC到FGPA,統(tǒng)統(tǒng)“人工智能滿天下”?如此沉默,對(duì)公司的未來妥當(dāng)嗎?

很遺憾的,人工智能芯片從2018 年起,以中國相關(guān)領(lǐng)域新創(chuàng)公司為首,熱潮急速退燒,像中國DEEPHi(深鑒科技)被FPGA 巨頭賽靈思收購,已經(jīng)算是最好的退場(chǎng)。

即使美國企業(yè)亦不可免俗,就算公司不會(huì)倒,也不保證產(chǎn)品線不會(huì)收掉。像這些年來癡迷自駕車和人工智能,耗費(fèi)數(shù)百億美元“生氣亂買公司”的英特爾,2018年宣布中止XeonPhi產(chǎn)品線,決定整個(gè)砍掉重練,由2017年底來自AMD的Raja Koduri重建貨真價(jià)實(shí)的GPU。2019年底以20億美元購并以色列HabanaLabs并在隔年2月停止NNP-T1000(代號(hào)Spring Crest,還宣稱跟百度合作),也意味著2016年用3.5億美元買下的Nervana形同棄兒,英特爾人工智能平臺(tái)事業(yè)群負(fù)責(zé)人、Nervana聯(lián)合創(chuàng)辦人Naveen Rao隨即離職,一點(diǎn)都不讓人意外。

英特爾連續(xù)公開栽了兩次(實(shí)際上應(yīng)該更多),事后諸葛的后見之明與背后補(bǔ)刀的內(nèi)幕爆料,均朝向“做出來的東西根本不能用,也無法符合軟件開發(fā)者和潛在客戶的需求”。

所以這也是當(dāng)人工智能漸漸在HotChips 退燒后,為何Google 和nVidia 可站在臺(tái)上活好好的主因:Google 很清楚自身需要,快速演進(jìn)三代(應(yīng)該更多)的TPU 就是為了自家Google Cloud AI 和其他服務(wù)量身訂做(蘋果塞在自己芯片內(nèi)的NPU 也是一樣狀況)。nVidia 則是擁有龐大GPU 市占率、累積十多年的CUDA 與高效能運(yùn)算的“基本盤”足以先養(yǎng)活自己,日后再慢慢發(fā)展。

反觀之前那票一窩蜂狂沖“人工智能新大陸”的勇者,又有幾家有本錢和能耐,先不求餓死,再講求和客戶攜手并進(jìn)的共同勝利?講更白一點(diǎn),你會(huì)相信中國那些開發(fā)數(shù)字貨幣挖礦芯片的廠商,被迫轉(zhuǎn)型做出來的人工智能芯片,可以迅速得到指標(biāo)性客戶的青睞?

天下任何一家求生存的企業(yè),無不企求有所謂的“現(xiàn)金母牛”和忠實(shí)客戶,才為穩(wěn)定營運(yùn)的基礎(chǔ)。我們可以猜猜看,明年HotChips 33 還剩下哪些幸存者?
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20084

    瀏覽量

    243798
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53250

    瀏覽量

    455283
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10247

    瀏覽量

    178507
  • 人工智能
    +關(guān)注

    關(guān)注

    1812

    文章

    49536

    瀏覽量

    259252
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DNR6521x_VC1:革新音頻體驗(yàn)的AI降噪處理器

    在當(dāng)今數(shù)字時(shí)代,高質(zhì)量的音頻處理需求日益增長。無論是直播、游戲、會(huì)議還是專業(yè)錄音,都需要清晰、純凈的聲音體驗(yàn)。DNR6521x_VC1作為一款基于XMOS處理器架構(gòu)的AI深度降噪處理器
    的頭像 發(fā)表于 10-15 16:59 ?997次閱讀
    DNR6521x_VC1:革新音頻體驗(yàn)的<b class='flag-5'>AI</b>降噪<b class='flag-5'>處理器</b>

    DNR65211-VC1單通道AI深度降噪處理器技術(shù)解析

    一、產(chǎn)品概述DNR65211-VC1是飛騰云音頻推出的高性能AI音頻處理方案,基于XMOS處理器架構(gòu)設(shè)計(jì),專為直播/會(huì)議/戶外等場(chǎng)景提供智能化音頻解決方案。該產(chǎn)品集成雙AI降噪模型與多
    的頭像 發(fā)表于 10-08 15:32 ?198次閱讀
    DNR65211-VC1單通道<b class='flag-5'>AI</b>深度降噪<b class='flag-5'>處理器</b>技術(shù)解析

    瑞薩電子RZ/V系列微處理器助力邊緣AI開發(fā)

    邊緣AI越來越多地應(yīng)用于諸如工業(yè)攝像頭和公共設(shè)施攝像頭等嵌入式設(shè)備中,并要求嵌入式產(chǎn)品小型化且具有低功耗。瑞薩電子RZ/V系列微處理器(MPU)內(nèi)置AI加速,即動(dòng)態(tài)可重構(gòu)
    的頭像 發(fā)表于 09-23 10:31 ?374次閱讀
    瑞薩電子RZ/V系列微<b class='flag-5'>處理器</b>助力邊緣<b class='flag-5'>AI</b>開發(fā)

    【解構(gòu)·AI玩具】從“小智AI”引爆開發(fā)者熱潮說起

    一、AI玩具爆火,“小智AI”引爆全民熱潮 在眾多AI硬件產(chǎn)品當(dāng)中,AI玩具曾長期被視為邊緣品類,相較于滿足功能性需求的
    發(fā)表于 05-20 09:20 ?1974次閱讀
    【解構(gòu)·<b class='flag-5'>AI</b>玩具】從“小智<b class='flag-5'>AI</b>”引爆開發(fā)者<b class='flag-5'>熱潮</b>說起

    Cadence推出Tensilica NeuroEdge 130 AI協(xié)處理器

    Vision DSP 系列的成熟架構(gòu),能夠在不影響性能的情況下,將面積縮減超過 30%,并將動(dòng)態(tài)功耗和能耗降低超過 20%。此外,該處理器還利用相同的軟件、AI 編譯、庫和框架,加快產(chǎn)品上市進(jìn)程。目前已有多家客戶表達(dá)強(qiáng)烈興趣
    的頭像 發(fā)表于 05-17 09:38 ?951次閱讀

    光子 AI 處理器的核心原理及突破性進(jìn)展

    電子發(fā)燒友網(wǎng)(文 / 李彎彎)光子 AI 處理器,作為一種借助光子執(zhí)行信息處理與人工智能(AI)計(jì)算的新型硬件設(shè)備,正逐漸嶄露頭角。與傳統(tǒng)基于晶體管的電子
    的頭像 發(fā)表于 04-19 00:40 ?3425次閱讀

    在線研討會(huì) @4/10 ASTRA?賦能邊緣 AI:探索 Synaptics SL &amp;amp; SR 處理器的無限可能

    邊緣AI的發(fā)展正在改變智能設(shè)備的未來,而cASTRA系列處理器正是這一領(lǐng)域的佼佼者。2025年4月10日(周四)上午10點(diǎn)至11點(diǎn),大聯(lián)大詮鼎集團(tuán)聯(lián)合Synaptics新突思將舉辦“ASTRA賦能
    的頭像 發(fā)表于 04-02 16:34 ?822次閱讀
    在線研討會(huì) @4/10 ASTRA?賦能邊緣 <b class='flag-5'>AI</b>:探索 Synaptics SL &amp;amp; SR <b class='flag-5'>處理器</b>的無限可能

    AI MPU# 瑞薩RZ/V2H 四核視覺 ,采用 DRP-AI3 加速和高性能實(shí)時(shí)處理器

    RZ/V2H 高端 AI MPU 采用瑞薩電子專有的AI 加速-動(dòng)態(tài)可重配置處理器 (DRP-AI3)、四核 Arm^?^ Cortex
    的頭像 發(fā)表于 03-15 11:50 ?1800次閱讀
    <b class='flag-5'>AI</b> MPU# 瑞薩RZ/V2H 四核視覺 ,采用 DRP-<b class='flag-5'>AI</b>3 加速<b class='flag-5'>器</b>和高性能實(shí)時(shí)<b class='flag-5'>處理器</b>

    集特 國產(chǎn)飛騰處理器工控主板GM9-2602

    處理器
    集特國產(chǎn)工控產(chǎn)品
    發(fā)布于 :2025年03月12日 14:07:04

    端側(cè) AI 音頻處理器:集成音頻處理AI 計(jì)算能力的創(chuàng)新芯片

    電子發(fā)燒友網(wǎng)綜合報(bào)道:端側(cè) AI 音頻處理器是專為智能物聯(lián)網(wǎng)(AIoT)端側(cè)設(shè)備設(shè)計(jì),集成了人工智能(AI)加速的系統(tǒng)級(jí)音頻處理器。這類
    的頭像 發(fā)表于 02-16 00:13 ?2758次閱讀

    量子處理器的作用_量子處理器的優(yōu)缺點(diǎn)

    量子處理器(QPU),又稱量子級(jí)計(jì)算機(jī)處理器,是量子計(jì)算機(jī)中的核心部件,其作用主要體現(xiàn)在以下幾個(gè)方面:   一、高速計(jì)算與處理能力   量子處理器利用量子比特的疊加和糾纏特
    的頭像 發(fā)表于 01-27 13:44 ?1303次閱讀

    量子處理器是什么_量子處理器原理

    量子處理器(QPU)是量子計(jì)算機(jī)的核心部件,它利用量子力學(xué)原理進(jìn)行高速數(shù)學(xué)和邏輯運(yùn)算、存儲(chǔ)及處理量子信息。以下是對(duì)量子處理器的詳細(xì)介紹:
    的頭像 發(fā)表于 01-27 11:53 ?1499次閱讀

    Ampere發(fā)布最新192核12內(nèi)存通道AmpereOne M處理器

    Ampere 發(fā)布了旗艦產(chǎn)品 AmpereOne 處理器的新版本,擁有 12 個(gè)內(nèi)存通道的最新處理器。正如 Ampere 在去年5月份的年度戰(zhàn)略和產(chǎn)品路線圖更新中提到的,公司正在構(gòu)建
    的頭像 發(fā)表于 01-09 13:44 ?860次閱讀

    EE-340: SHARC處理器和Blackfin處理器的SPI連接

    電子發(fā)燒友網(wǎng)站提供《EE-340: SHARC處理器和Blackfin處理器的SPI連接.pdf》資料免費(fèi)下載
    發(fā)表于 01-08 15:04 ?0次下載
    EE-340: SHARC<b class='flag-5'>處理器</b>和Blackfin<b class='flag-5'>處理器</b>的SPI連接

    盛顯科技:異形拼接處理器和傳統(tǒng)拼接處理器有什么區(qū)別?

    現(xiàn)如今,隨著科技的不斷發(fā)展,拼接處理器已在眾多領(lǐng)域展現(xiàn)出其廣泛的適用性,尤其是異形拼接處理器,作為實(shí)現(xiàn)異形拼接屏功能的尖端設(shè)備,更是脫穎而出,它能夠巧妙地整合多個(gè)顯示屏,包括液晶顯示屏、LED顯示屏
    的頭像 發(fā)表于 11-06 10:52 ?786次閱讀