chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何透過數(shù)字直剖本質(zhì)評估AI芯片的真實(shí)性能?

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 作者:地平線HorizonRobot ? 2021-05-03 18:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特斯拉 Hardware 3.0 的效率之謎

特斯拉在其推出的 Hardware 3.0 自動駕駛平臺中,采用自研芯片替代了Nvidia Drive PX2,其理論算力直線提升了 3 倍,而以 MAPS 方式來評估,其真實(shí) AI 性能更是驚人的提升了 21 倍。具體而言,Hardware 2.0 時每秒只能處理 110 幀圖像,而現(xiàn)在則高達(dá) 2300 幀。

那么,Hardware 的效率提升應(yīng)該如何認(rèn)識呢?在“算力至上”的今天,如何透過數(shù)字直剖本質(zhì)評估 AI 芯片的真實(shí)性能?

算力攀升,為什么卻看不到實(shí)用性?

隨著芯片制程技術(shù)的演進(jìn),摩爾定律的發(fā)展卻逐漸進(jìn)入瓶頸期,這與當(dāng)下計(jì)算 AI 計(jì)算需求量爆發(fā)式的增長顯得格格不入。追求純算力突破并不可持續(xù),同時算力也并不代表汽車智能芯片“真實(shí)性能”,芯片計(jì)算效率也同樣需要關(guān)注。于是,軟硬結(jié)合、算法加持的 AI 芯片接過了跑贏新場景的接力棒。

當(dāng)前,行業(yè)普遍以“TOPS”為單位來評估AI的理論峰值算力。盡管在目前主流的AI芯片性能基準(zhǔn)測試( MLPerf )下很多頂級廠商頻繁刷新榜單記錄,但在實(shí)際場景下的算力有效利用率卻差強(qiáng)人意。

2b80db88-9572-11eb-8b86-12bb97331649.png

人們逐漸認(rèn)識到,AI 芯片理論峰值算力并不一定能在實(shí)際運(yùn)行中完全釋放。例如,一款擁有理論峰值算力為 16 TOPS 的芯片,在計(jì)算不同模型時甚至?xí)薪咏?80% 的差異。此外,在卷積神經(jīng)網(wǎng)絡(luò)任務(wù)實(shí)測中,從 2014 年到 2019 年,最好的神經(jīng)網(wǎng)絡(luò)計(jì)算效率相差了 100 倍,相當(dāng)于計(jì)算效率每 9 個月翻一倍,遠(yuǎn)快于每 18 個月翻倍的摩爾定律。因此在模型算法演進(jìn)速度遠(yuǎn)快于芯片性能提升的速度的現(xiàn)在,不僅需要算力更高的芯片,也需要更合理的性能評估方法幫助用戶選擇適合的 AI 芯片。

對這些 AI 時代出現(xiàn)的新變化,以地平線為代表的 AI 芯片企業(yè)認(rèn)為,單純依賴于 PPA 芯片設(shè)計(jì)指標(biāo),很容易陷入算力至上的“誤區(qū)”,但算力并不是完全反應(yīng)芯片性能唯一評估標(biāo)準(zhǔn)。因此,地平線提出了 MAPS(Mean Accuracy-guaranteed Processing Speed)概念和評估方法,以此作為檢驗(yàn) AI 性能的真正標(biāo)準(zhǔn)。通俗來說,就是在特定的 AI 應(yīng)用領(lǐng)域,看芯片處理 AI 任務(wù)的速度和精度,即“多快”和“多準(zhǔn)”。

MAPS 動態(tài)評估芯片真實(shí) AI 性能

隨著 AI 算法的不斷演進(jìn),幾乎每 10-14 個月,相同的計(jì)算精度計(jì)算量可以下降一半。這種提升與算法設(shè)計(jì)的精妙程度息息相關(guān),但算法的快速演進(jìn)也對計(jì)算架構(gòu)提出巨大的挑戰(zhàn),尤其是對傳統(tǒng)通用的并行架構(gòu)而言,例如亟需高效AI專用處理器的自動駕駛場景。

MAPS 其實(shí)是在物理算力的基礎(chǔ)上,通過對大量模型的測試,綜合各個模型的速度(正比與物理算力*實(shí)際利用率)和準(zhǔn)確率得到的最佳方案的量化結(jié)果。它更聚焦于使用戶能夠通過可視化的圖表直觀的感知 AI 芯片真實(shí)算力。正如對于汽車來說,馬力(單位: HP)不如百公里加速時間(單位:秒)更真實(shí)反映整車動力性能;算力(單位: TOPS)并不反映汽車智能芯片實(shí)際性能,而每秒準(zhǔn)確識別幀率 MAPS(單位: FPS)才是更真實(shí)的性能指標(biāo)。

2bb9df64-9572-11eb-8b86-12bb97331649.png

MAPS=最佳模型多邊形面積/(精度上界—精度下界),其中橫軸反應(yīng)幀率,縱軸反應(yīng)精度

此外,在自動駕駛中應(yīng)該如何對速度和精度做取舍呢?現(xiàn)實(shí)生活中我們經(jīng)常遇到一些極端的案例,例如當(dāng)汽車遭遇小孩子橫穿馬路的突發(fā)狀況時,如果自動駕駛識別延時過高,會剎車不及時;如果精度不夠,則會造成無法識別。在很多類似的場景中,我們往往面臨既要“快”,又要兼顧“準(zhǔn)”的境況。而在 MAPS 評估方法下,我們可以清晰看到幀率和精度之間的動態(tài)關(guān)系,這也是其對實(shí)際場景的重要價值之一。

更高級別自動駕駛需要多少“FPS”?

軟件定義的汽車的趨勢下,未來汽車正逐步成為四個輪子上的超級計(jì)算機(jī)。可以清晰預(yù)見的是,電動車賣點(diǎn)不是車,而是「智能」,這是一個堪比計(jì)算機(jī)誕生級別的創(chuàng)新。

特斯拉在 Hardware 3.0 中,采用其自研 AI 芯片 FSD Chip 替代了 Hardware 2.5 中的 Nvidia Drive PX2,算力從 24 TOPS 提升到了 72 TOPS,但運(yùn)行同樣模型的精度卻驚人的提升了 21 倍。具體而言,Hardware 2.0 時每秒只能處理 110 幀圖像,而現(xiàn)在則高達(dá) 2300 幀。除了絕對算力的提升,額外提升則來自于利用率的提升。同時特斯拉也宣布針對 Hardware 3.0 重寫自動駕駛軟件,從而在 2020 年 10 月推出了 FSD beta,這是唯一不受場地限制、大規(guī)模測試的自動駕駛方案。

特斯拉革命性技術(shù)的重構(gòu)與 MAPS背后體現(xiàn)的理念有相通之處:提升物理算力(HW 3.0 提升 3 倍)、提升利用率(提升近 2 倍),找到最佳的速度和準(zhǔn)確率提升(重寫自動駕駛軟件),使得特斯拉從簡單場景的 NOA 一步步突破到不受限的自動駕駛。而地平線在芯片設(shè)計(jì)之中一直貫徹 MAPS 背后的技術(shù)理念,關(guān)注提升物理算力的同時關(guān)注利用率的提升,并且不斷把算法發(fā)展趨勢,使得軟硬件可以協(xié)同共振,發(fā)揮最高效能。

為了助力汽車廠商突破“特斯拉困境”,實(shí)現(xiàn)高級別自動駕駛的落地。地平線即將推出的征程 5 MAPS 整體跑分高達(dá) 3020 FPS,其中 MAPS@COCO (檢測任務(wù)COCO MAPS) 跑分可高達(dá) 116,而 Nvidia Xavier MAPS@COCO 為 41 FPS (GPU&DLA@32W mode ),如此高的性能將助力車廠加速實(shí)現(xiàn)自動駕駛方案的落地。

驅(qū)動新基建數(shù)字底座,需要有算力也要有效率。自成立以來,地平線便致力于兼?zhèn)渌懔εc效率的高性能芯片。未來,地平線將推出性能更強(qiáng)大的征程6,其不僅在功耗、面積優(yōu)化的基礎(chǔ)上,同時在MAPS上繼續(xù)提升一個數(shù)量級,助力全行業(yè)共同努力進(jìn)一步大幅提升自動駕駛的安全性。

原文標(biāo)題:不看算力看效率,更高級別的自動駕駛需要多少 “FPS”?

文章出處:【微信公眾號:地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 特斯拉
    +關(guān)注

    關(guān)注

    66

    文章

    6392

    瀏覽量

    130801
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37208

    瀏覽量

    291564
  • 自動駕駛
    +關(guān)注

    關(guān)注

    791

    文章

    14558

    瀏覽量

    174461

原文標(biāo)題:不看算力看效率,更高級別的自動駕駛需要多少 “FPS”?

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    一文理解模數(shù)轉(zhuǎn)換器中的有效位數(shù)

    隨著測量精度要求提升,有效位數(shù)(ENOB)已成為評估ADC、數(shù)字示波器真實(shí)性能的核心指標(biāo)。ENOB由IEEE定義,綜合了噪聲、抖動、非線性失真等誤差,反映設(shè)備在實(shí)際使用中的“有效分辨率”。
    的頭像 發(fā)表于 10-09 11:01 ?2175次閱讀
    一文理解模數(shù)轉(zhuǎn)換器中的有效位數(shù)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    和探索;人類級別的理解能力;常識推理;現(xiàn)實(shí)世界的知識整合。 3、測試時計(jì)算 測試時計(jì)算(TTC)是指在模型推理階段利用額外的計(jì)算資源來提升泛化性能。 4、具身智能與滲透式AI 1)具身智能對AGI的意義
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    主要步驟: ①溯因②假說③實(shí)驗(yàn) 1、科學(xué)推理的類型 ①演繹②歸納 2、自動化科學(xué)發(fā)現(xiàn)框架 AI-笛卡兒-----自動化科學(xué)發(fā)現(xiàn)框架,利用數(shù)據(jù)和知識來生成和評估候選的科學(xué)假說。 4項(xiàng)規(guī)則:三、直覺
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    的同時,能夠利用更小、更快的數(shù)字格式,提升模型的整體性能。 1.3Transformer 模型中的矩陣乘法計(jì)算 2、存內(nèi)計(jì)算AI芯片 存內(nèi)計(jì)算已經(jīng)成為應(yīng)對大模型不斷增加的計(jì)算量和能耗
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    AI芯片:科技探索與AGI愿景》這本書是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術(shù)與創(chuàng)新未來》一書是姊妹篇,由此可見作者在AI
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場晉升新契機(jī)?

    芯片設(shè)計(jì)為例,從最初的架構(gòu)選型,到算法適配、性能優(yōu)化,每個環(huán)節(jié)都考驗(yàn)著工程師的專業(yè)素養(yǎng)。在設(shè)計(jì)一款面向智能安防領(lǐng)域的 AI 芯片時,需要深入研究安防場景下圖像識別算法的特點(diǎn),針對性地
    發(fā)表于 08-19 08:58

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    名單公布 @LiuDW、@jinglixixi、@bruceleesohu 請于9月3日前,前往【書籍評測活動NO.64】《AI芯片:科技探索與AGI愿景》完成書籍兌換。 如有疑問請 添加小助手微信
    發(fā)表于 07-28 13:54

    是德科技推出AI數(shù)據(jù)中心構(gòu)建器以驗(yàn)證和優(yōu)化網(wǎng)絡(luò)架構(gòu)和主機(jī)設(shè)計(jì)

    ·?通過模擬真實(shí)工作負(fù)載驗(yàn)證AI基礎(chǔ)設(shè)施的性能 ·?通過評估新算法、組件或協(xié)議提高AI訓(xùn)練的性能
    的頭像 發(fā)表于 04-10 08:50 ?420次閱讀

    江西萬年芯通過數(shù)字化轉(zhuǎn)型成熟度星級評估

    2星級評估證書”。這一評估結(jié)果不僅是對企業(yè)數(shù)字化轉(zhuǎn)型階段性成果的認(rèn)可,也標(biāo)志著萬年芯在智能化改造和數(shù)字化轉(zhuǎn)型的道路上邁出了堅(jiān)實(shí)的一步。數(shù)字
    的頭像 發(fā)表于 02-19 15:35 ?722次閱讀
    江西萬年芯通<b class='flag-5'>過數(shù)字</b>化轉(zhuǎn)型成熟度星級<b class='flag-5'>評估</b>

    數(shù)字電路仿真實(shí)現(xiàn)

    電子發(fā)燒友網(wǎng)站提供《數(shù)字電路仿真實(shí)現(xiàn).pdf》資料免費(fèi)下載
    發(fā)表于 01-21 09:24 ?2次下載
    <b class='flag-5'>數(shù)字電路仿真實(shí)</b>現(xiàn)

    AI跑分超8000,天璣9400憑實(shí)力碾壓一眾旗艦芯片

    蘇黎世AI Benchmark榜單冠軍,以稱霸行業(yè)的AI性能,加速智能手機(jī)的智能體化進(jìn)程。 AI Benchmark自2018年推出以來,一
    的頭像 發(fā)表于 01-10 12:40 ?1334次閱讀
    <b class='flag-5'>AI</b>跑分超8000,天璣9400憑實(shí)力碾壓一眾旗艦<b class='flag-5'>芯片</b>

    ADS1299如何保證數(shù)據(jù)真實(shí)性?

    %時,調(diào)整為6倍增益。 后面的AD轉(zhuǎn)換是接近實(shí)時的轉(zhuǎn)換,在調(diào)整增益時,如何保障記錄到的調(diào)整數(shù)據(jù)接近真實(shí)的連接,即保證數(shù)據(jù)真實(shí)性。
    發(fā)表于 11-26 06:16

    多通道負(fù)載測試和性能評估?

    情況下的性能。這種測試通常用于評估系統(tǒng)的最大處理能力,以及確定系統(tǒng)在何種負(fù)載下開始出現(xiàn)性能下降。多通道負(fù)載測試可以模擬真實(shí)的用戶行為,包括用戶的請求、響應(yīng)和數(shù)據(jù)處理等。 在進(jìn)行多通道負(fù)
    發(fā)表于 11-11 16:44