chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

建立AI芯片新的衡量標準勢在必行

454398 ? 來源:機器之心 ? 作者:半導體觀察 ? 2020-10-28 12:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

因為人工智能的持續(xù)火熱,AI芯片在過去幾年里如雨后春筍般在全球各地冒出來。這就驅動行業(yè)去探索評估AI芯片性能的最優(yōu)方法。

就如傳統(tǒng)的芯片設計師追求PPA、CPU對比MIPS、GPU衡量Pixel和Texture一樣,一個好的評估方法能夠讓開發(fā)者可以針對場景進行設計,同時可以指導研發(fā)調整優(yōu)化防線,引導客戶進行正確選擇,同時能夠促進行業(yè)有序協(xié)同向前發(fā)展。

快速提升的AI算法和落后的衡量方法

地平線聯合創(chuàng)始人&技術副總裁黃暢在日前于深圳舉辦的2020全球人工智能和機器人峰會上指出,Intel聯合創(chuàng)始人戈登摩爾在1965年提出摩爾定律,這揭示信息技術進步速度的定律得到了充分的行業(yè)驗證。但進入最近幾年,半導體工藝已經接近了尾聲。

“與此同時,AI對算力的要求大幅度增加,那就意味著如果我們如果僅靠半導體工藝的提升來滿足快速增長AI需求,那就變得不甚現實?!秉S暢說。為此大家都開始將目光投向計算效率。

以ImageNet為例,作為AI領域的奧林匹克競賽,它吸引了學術界和產業(yè)界的關注,而在過去的發(fā)展中,則分為三個階段:第一階段是通過算法專家精心設計網絡結構,不斷增加計算量提升ImageNet的精度;到了第二階段的ResNet,它的精度、計算量都有顯著提升;在后續(xù)幾年,來自谷歌等等各個領域的專家通過手工設計新的網絡結構,不斷地推動這個算法演進,使得我們可以以更低的計算量達到更高的精度。

“ 從2016年到2018年,我們發(fā)現在ImageNet上的精度基礎趨近飽和,精準度始終保持在80%的水平,精度發(fā)生飽和之后,大家開始關注計算的效率,越來越多的效率也得到了重視,并推出了非常多輕量級網絡”,黃暢補充說?!叭ツ闑fficientNet的推出更是震驚了長期關注ImageNet的所有的學術研究者”,黃暢強調。

他指出,EfficientNet的基準網絡和硬件無關,它只關注計算量本身,也就是進行了多少次乘法或加法的運算,其中最小的網絡只有0.4G,并且還能自動化搜索網絡的所有結構。此外,它還要搜索層次、圖像分別率,所帶來的的不僅是參數提升了,分辨率也同時提升了,有助于它提升圖像識別的精度。

然而回到人工智能的性能評估領域,從TFLOPS,到TOPS,再到近三年MLPerf的崛起,AI芯片依然沒能找到準確的衡量標準。以MLPerf為例,雖然這個評估標準給大家提供了一個展現AI芯片能力的平臺,但它依然面臨著幾方面的挑戰(zhàn),這與他們在測試前必須選定模型有關?!澳P透路浅B?,根本無法及時反應整個算法效率的提升。而模型又非常少,也很難反映各個精度上速度全貌”,

由此可見,為AI芯片建立一個新的衡量標準勢在必行。

全新的芯片AI性能評估方式——MAPS

在黃暢看來,評估芯片的AI性能,可以從準、快、省這三個維度來看。其中“準”是反映實際需求任務上的算法精度,比如說圖像分類里面我們用Top-1或者Top-5的精度判斷它是不是準;“快”的方面,通常有延遲和吞吐率兩個維度,前者更側重于處理單個任務的最快反應時間,后者應用于你可以在服務器層面上用最大的處理方式處理它的吞吐率;“省”就是看它的成本和功耗。

“對于AI芯片的性能評估來講,準和快是兩個非常重要的因素”。黃暢強調。

基于此,地平線提出了新的芯片AI性能評估方式——MAPS,即MeanAccuracy-guaranteed processing speed(在精度有保障范圍內的平均處理速度)。這個新方式的提出,是想在精度有保障的范圍測出芯片的平均效能表現,并得到一個全面、完整、客觀和真實的評估。按照黃暢的說法,這個全新的評估方式對行業(yè)來說有六大創(chuàng)新之處:

第一,它可以可視化芯片的Benchmark,我們可以通過可視化的圖形更精確的表達;

第二,我們關注真實、面向結果的需求,只在乎精度和速度,不在乎中間任何關于算法的取舍和選擇;

第三,可以統(tǒng)一表示精度與速度,關注主流精度區(qū)間;

第四,隱藏與最終結果無關的中間變量,包括模型、輸入大小、批處理的量是多大;

第五,通過這種方法可以在算力之外幫助用戶理解這個芯片到底能跑多快以及多好,最終留有最大的空間引導客戶使用最優(yōu)的方式使用這顆芯片,指導客戶使用這個芯片的最佳實踐。

第六,有最大的空間引導客戶使用最優(yōu)的方式使用這顆芯片,作為指導客戶使用芯片最佳實踐的這一點非常重要。

作為 AI 領域的奧林匹克競賽,ImageNet 比賽產生了幾乎所有機器視覺中最重要的模型,它們在 ImageNet 上的精度可充分遷移到其他機器視覺任務(如物體檢測、語義分割等)。在 ImageNet 的主流精度范圍(75~80%)下,速度最快的模型所代表的點(由精度和幀率確定)所圍多邊形面積大小即為芯片處理ImageNet AI任務的能力大小,其公式為MAPS = 所圍面積 /(最高精度-最低精度)。在演講現場,黃暢還展示了MAPS評估方式在在ImageNet上的定義與主流芯片測試結果。

上圖為MAPS評估方式下主流芯片測試結果,右一折線為地平線最新一代芯片測試結果 “如果我們用MAPS,它是更能真實反映AI性能指標”,黃暢說。如下圖所示,這主要由三個要素組成:第一是TOP/Watt、TOPS/$這樣的指標,這是傳統(tǒng)的方式。等式右邊則是由理論峰值計算效能、有效利用率和AI算法效率構成。

“我們希望有更多的軟件、算法工作者,在MAPS評估指導體系的啟發(fā)下,從自己最擅長的能力上持續(xù)推動AI芯片能力的發(fā)揮”,黃暢最后說。
編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11213

    瀏覽量

    222793
  • 人工智能
    +關注

    關注

    1813

    文章

    49711

    瀏覽量

    261275
  • 半導體工藝
    +關注

    關注

    19

    文章

    107

    瀏覽量

    26889
  • AI芯片
    +關注

    關注

    17

    文章

    2060

    瀏覽量

    36550
  • 算力
    +關注

    關注

    2

    文章

    1381

    瀏覽量

    16552
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    VS680 HDMI AI分析解決方案 #目標識別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導體
    發(fā)布于 :2025年11月12日 10:29:33

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    建立的基礎: ①算力支柱②數據支柱③計算支柱 1)算力 與AI算力有關的因素: ①晶體管數量②晶體管速度③芯片架構④芯片面積⑤制造工藝⑥芯片
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    流體芯片AI計算平臺 ⑥基于AI的自主決策系統(tǒng) ⑦基于AI的自主學習系統(tǒng) 2、面臨的挑戰(zhàn) ①需要造就一個跨學科、全面性覆蓋的知識庫和科學基礎模型 ②需要解決信息不準確和認知偏差問題
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+化學或生物方法實現AI

    順序排列并存儲在毛細血管內。 電石存儲器: 3、化學計算的總體現狀與前景 二、生物計算 1、用活細胞實現AI 作者第七章才會介紹類腦芯片,到時候我們再一起欣賞吧。 這里只是先給我們打了個基礎概念。 1
    發(fā)表于 09-15 17:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創(chuàng)新方法與架構

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實現深度學習AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(ISA)。優(yōu)勢如下: ①模塊化特性②
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,FPGA屬于AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導體芯片技術加以實現。 而大腦是一個由無數神經元通過突觸連接而成的復雜網絡,是極其復雜和精密的。大腦在本質上就是一臺濕潤的軟組織
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽

    AI芯片:科技探索與AGI愿景》這本書是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術與創(chuàng)新未來》一書是姊妹篇,由此可見作者在AI
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場晉升新契機?

    在科技飛速發(fā)展的當下,AI 芯片已然成為眾多行業(yè)變革的核心驅動力。從互聯網巨頭的數據中心,到我們日常使用的智能手機、智能家居設備,AI 芯片的身影無處不在,深刻改變著產品形態(tài)與服務模式
    發(fā)表于 08-19 08:58

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    名單公布 @LiuDW、@jinglixixi、@bruceleesohu 請于9月3日前,前往【書籍評測活動NO.64】《AI芯片:科技探索與AGI愿景》完成書籍兌換。 如有疑問請 添加小助手微信
    發(fā)表于 07-28 13:54

    AI芯片上的應用:革新設計與功能

    AI芯片上的應用正在深刻改變著芯片設計、制造和應用的全過程。未來,隨著AI技術的不斷進步和應用場景的不斷拓展,AI
    的頭像 發(fā)表于 02-17 16:09 ?1241次閱讀

    deepseek國產芯片加速 DeepSeek的國產AI芯片天團

    ,從而紛紛繼續(xù)“卷”起來,效仿DeepSeek的“開源”模式。 對于DeepSeek本身,人們關注其如何在有限算力實現強大性能,更關注其在重重條令圍城之下的未來之路。而在最近,全世界的芯片廠商集體出動,紛紛宣布支持DeepSeek。尤其是眾多國產AI
    的頭像 發(fā)表于 02-10 15:07 ?5038次閱讀
    deepseek國產<b class='flag-5'>芯片</b>加速 DeepSeek的國產<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>天團

    算智算中心的算力如何衡量?

    (ComputationalPower)是指智算中心通過其內部的計算設備(如CPU、GPU、AI芯片等)對數據進行處理和計算的能力。它體現了智算中心在單位時間內能夠完成的計算任務量,
    的頭像 發(fā)表于 01-16 14:03 ?4127次閱讀
    算智算中心的算力如何<b class='flag-5'>衡量</b>?

    DAC80004的轉換速率是不是用setting time這個參數來衡量

    DAC的轉換速率是不是用setting time這個參數來衡量?如果建立時間是1us,是不是表示轉換速率是1Msps,我看到DAC80004的setting time是5.8us,在產品選型的時候
    發(fā)表于 12-31 08:00

    編碼器刻線數與精度數的關系

    編碼器刻線數與精度數的關系!精度數的衡量標準:精度數的衡量標準通常包括分辨率、重復性和準確性等。分辨率是指編碼器能夠檢測到的最小位置變化;重復性是指在相同條件下多次測量時結果的一致性;準確性則是指
    的頭像 發(fā)表于 12-18 10:41 ?1357次閱讀
    編碼器刻線數與精度數的關系