chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ADS2.0算法演進(jìn)與對(duì)算力的新需求

佐思汽車研究 ? 來源:佐思汽車研究 ? 作者:Dr. Luo ? 2022-06-14 11:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

愛因斯坦有曰,“瀚宇初開,萬物當(dāng)生也。萬物可謂振動(dòng),能光旋律之蕩漾焉?!保ㄗⅲ鹤髡咧凶g)。AI新技術(shù)革命時(shí)代,大算力芯片也撥響了自動(dòng)駕駛ADS的琴弦。大珠小珠般的AI算法在大算力驅(qū)動(dòng)下應(yīng)運(yùn)而振,應(yīng)時(shí)而動(dòng),解決了ADS從L2到L5逐級(jí)演進(jìn)中的眾多技術(shù)難題。ADS每增加一級(jí),算力需求也會(huì)呈現(xiàn)十倍速上升,L4級(jí)別可預(yù)計(jì)的算力需求在1000TOPS,L5級(jí)別估計(jì)在2000-10000TOPS。如圖1所示,后摩爾時(shí)代工藝更新性能提升放緩,延續(xù)性創(chuàng)新的邊際效益遞減,新興的大算力架構(gòu)在不斷涌現(xiàn),加上駕駛AI算法高速迭代演進(jìn),在未來5-10年內(nèi)可能會(huì)為后來的技術(shù)追趕者提供非常奇妙的一個(gè)直線超車的機(jī)會(huì)窗口。

8f14599e-eb8f-11ec-ba43-dac502259ad0.png

圖1. 大算力時(shí)代自動(dòng)駕駛ADS領(lǐng)域的機(jī)遇與挑戰(zhàn)

當(dāng)前ADS自動(dòng)駕駛采用決策層后融合的方式,其局限性主要表現(xiàn)在在極端惡劣氣候與復(fù)雜遮擋等不確定性場(chǎng)景下分別進(jìn)行單模結(jié)構(gòu)化信息提取后再進(jìn)行融合決策,每個(gè)通道信息會(huì)有不同層面丟失,很難能夠進(jìn)行多模有效互補(bǔ)與特征提取共享,算力內(nèi)卷且性能遠(yuǎn)低于預(yù)期。 未來ADS算法會(huì)進(jìn)入一個(gè)全新的2.0階段,4D空間下基于時(shí)空的多模感知與融合推理, 也就是特征提取/統(tǒng)計(jì)推斷/應(yīng)急預(yù)測(cè)相結(jié)合,實(shí)現(xiàn)在動(dòng)態(tài)復(fù)雜的有噪聲干擾等場(chǎng)景下,全程安全無碰撞的高效行駛。挑戰(zhàn)可以體現(xiàn)在,動(dòng)態(tài)隨機(jī)的人車物交互,多變天氣路況,以及突發(fā)交通事件等。

ADS算法2.0從決策層后融合走向特征級(jí)前融合,當(dāng)前行業(yè)ADS2.0算法主要演進(jìn)方向?yàn)椋?/p>

多模感知:主要是針對(duì)Camera/LiDAR/Radar海量數(shù)據(jù)流進(jìn)行特征提取,DL網(wǎng)絡(luò)主流趨勢(shì)是卷積CNN或者貝葉斯NN+Transformer的組合架構(gòu),在統(tǒng)一的特征空間實(shí)現(xiàn)多模感知,特征融合共享以及多任務(wù)來提升算力的整體效率。

融合推理:主要是基于模型與基于數(shù)據(jù)的雙學(xué)習(xí)模式,DL網(wǎng)絡(luò)主流趨勢(shì)是基于目標(biāo)交互GNN或基于統(tǒng)計(jì)模型的貝葉斯RL強(qiáng)化學(xué)習(xí)或On-Policy應(yīng)急學(xué)習(xí),實(shí)現(xiàn)ADS安全可信的預(yù)測(cè)規(guī)劃與控制。

ADS2.0算法演進(jìn)與對(duì)算力的新需求,可以總結(jié)為:

演進(jìn)趨勢(shì)1:感知定位預(yù)測(cè)決策控制模塊化處理流程中, 從決策層后融合走向感知層前融合,算法能夠在統(tǒng)一空間支持多模融合,多任務(wù)共享;

演進(jìn)趨勢(shì)2:預(yù)測(cè)與規(guī)劃聯(lián)合建模,從可獲得的Off-policy數(shù)據(jù)進(jìn)行學(xué)習(xí),能夠自學(xué)習(xí)處理不確定性下的安全性問題,解決可解釋問題,持續(xù)學(xué)習(xí)解決新場(chǎng)景問題;

算力新需求:從compute-bound(矩陣-矩陣乘)走向memory-bound(矩陣-矢量乘),從偏計(jì)算走向偏存取。

當(dāng)前市場(chǎng)上主流算力NPU芯片,都存在幾個(gè)共性問題,一是算法效率低,多數(shù)只針對(duì)CNN(例如3x3卷積)優(yōu)化;二是內(nèi)存墻問題:處理單元PE存算分離,數(shù)據(jù)共享難;三是能耗墻問題:數(shù)據(jù)重復(fù)搬移,耗能增加>30-70%。所以,當(dāng)前針對(duì)某些特定算法的芯片,無法解決未來ADS 2.0的需求。

從工程實(shí)踐上看,ADS 2.0算法需通過“硬件預(yù)埋,算法迭代,算力均衡”,提供一個(gè)向前兼容的解決方案,以通用大算力(CPU的5-10倍性能提升,NPU的100-500倍性能提升)來解決未來不確定性的算法演進(jìn):

底層架構(gòu)的演進(jìn):從存算分離過渡到近內(nèi)存計(jì)算,最終走向內(nèi)存計(jì)算;

數(shù)據(jù)通道與模型:高速數(shù)據(jù)接口;數(shù)據(jù)壓縮+模型壓縮+低精度逼近計(jì)算+稀疏計(jì)算加速;

并行的頂層架構(gòu):模型-硬件聯(lián)合設(shè)計(jì),以及硬設(shè)計(jì)可配置+硬件調(diào)度+軟運(yùn)行可編程調(diào)度引擎。

未來,自動(dòng)駕駛算法不會(huì)止步于ADS 2.0,而能夠真正支持人類自動(dòng)駕駛夢(mèng)想的算法ADS 3.0趨勢(shì),我們估計(jì)會(huì)采用一個(gè)DNN網(wǎng)絡(luò)來進(jìn)行端到端學(xué)習(xí)。設(shè)想一下,有足夠的專家駕駛數(shù)據(jù)用來做模仿學(xué)習(xí)或采用RL自學(xué)習(xí)模式,可以有效降低數(shù)據(jù)標(biāo)注的信息瓶頸與嚴(yán)重依賴,從而能夠從多模多樣化數(shù)據(jù)層面進(jìn)行非直接的推理或者博弈類的對(duì)抗學(xué)習(xí)。ADS 3.0目前來看模型的可信與可解釋程度依然遠(yuǎn)低于預(yù)期。ADS系統(tǒng)的總體演進(jìn)趨勢(shì),可以總結(jié)為:

場(chǎng)景演進(jìn):負(fù)載多樣性

?從數(shù)量有限的攝像頭設(shè)置走向 Camera + LiDAR + Radar 多模態(tài)組合。

趨勢(shì)演進(jìn):算法多樣性

?從CNN+Rule-based方案走向CNN, RNN,Transformer, GNN, Bayesian, Deep ReinforcementLearning, Dynamic DNN, NAS Generated DNN, Variably Quantized DNN多算法組合。

大算力時(shí)代,ADS系統(tǒng)首先是模仿人類的駕駛行為,通過注意力機(jī)制,期望在感知定位預(yù)測(cè)規(guī)劃控制領(lǐng)域提供遠(yuǎn)超人類的決策能力。這需要我們?cè)贏I的三要素(算法、算力、數(shù)據(jù))基礎(chǔ)上添加第四要素,知識(shí)或者常識(shí)。

8f88890e-eb8f-11ec-ba43-dac502259ad0.png

而上述要素,均需要在充分理解算法的快速迭代的大趨勢(shì)下,擁有充足的超大通用算力,ADS系統(tǒng)在離線模仿學(xué)習(xí)人類駕駛先驗(yàn)知識(shí)經(jīng)驗(yàn)與規(guī)則的基礎(chǔ)上,能夠提供在線自主學(xué)習(xí)能力,通過自學(xué)習(xí)激勵(lì)與博弈共贏策略應(yīng)對(duì)眾多不確定性的人機(jī)交互的復(fù)雜環(huán)境,能夠?qū)Q策不充分的場(chǎng)景下做到安全應(yīng)對(duì)和提供可信解釋能力。此外,大算力芯片也需要能夠通過額外的算力,對(duì)芯片內(nèi)百萬級(jí)的并行計(jì)算單元提供故障檢測(cè)與安全規(guī)避能力,對(duì)大量多模傳感器的部分或者完全失效進(jìn)行有效檢測(cè)與應(yīng)對(duì)決策處理,對(duì)駕駛環(huán)境針對(duì)傳感器的主動(dòng)攻擊與外界目標(biāo)非主動(dòng)干擾進(jìn)行有效檢測(cè)與實(shí)時(shí)決策處理。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4759

    瀏覽量

    97102
  • ADS1220
    +關(guān)注

    關(guān)注

    24

    文章

    488

    瀏覽量

    126290
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    791

    文章

    14660

    瀏覽量

    176179

原文標(biāo)題:自動(dòng)駕駛行業(yè)快速迭代演變的算法和算力淺論

文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    國(guó)產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    反而壓到了310W。更有意思的是它的異構(gòu)架構(gòu):NPU+CPU+DVPP的組合,居然能同時(shí)扛住訓(xùn)練和推理場(chǎng)景,之前做自動(dòng)駕駛算法時(shí),用它跑模型時(shí)延直接降了20%。 但疑惑也有:這種密度下,散熱怎么解決?而且昇騰的生態(tài)適配速度能
    發(fā)表于 10-27 13:12

    與電力的終極博弈,填上了AIDC的“電力黑洞”

    ),專注于提供人工智能訓(xùn)練與推理所需的服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)。AIDC采用異構(gòu)計(jì)算架構(gòu),結(jié)合GPU、FPGA、ASIC等多種AI加速芯片,形成高并發(fā)分布式系統(tǒng),以滿足大模型訓(xùn)練和推理的極高
    的頭像 發(fā)表于 09-22 02:43 ?7309次閱讀

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動(dòng)AI邊緣計(jì)算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷演進(jìn)和物聯(lián)網(wǎng)應(yīng)用的持續(xù)拓展,騰視科技的AI
    的頭像 發(fā)表于 09-19 15:26 ?1109次閱讀
    什么是AI<b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動(dòng)AI邊緣計(jì)算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷演進(jìn)和物聯(lián)網(wǎng)應(yīng)用的持續(xù)拓展,騰視科技的AI
    的頭像 發(fā)表于 09-19 15:25 ?393次閱讀
    什么是AI<b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    一文看懂AI集群

    最近這幾年,AI浪潮席卷全球,成為整個(gè)社會(huì)的關(guān)注焦點(diǎn)。大家在討論AI的時(shí)候,經(jīng)常會(huì)提到AI集群。AI的三要素,是、算法和數(shù)據(jù)。而AI
    的頭像 發(fā)表于 07-23 12:18 ?918次閱讀
    一文看懂AI<b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    下一代云端生產(chǎn)的核心特征與技術(shù)演進(jìn)

    43EFLOPS(FP16),量子1138Qubit。這種多模態(tài)的協(xié)同調(diào)度,為AI推理、大模型訓(xùn)練等復(fù)雜場(chǎng)景提供支撐。 網(wǎng)智腦
    的頭像 發(fā)表于 04-22 07:42 ?431次閱讀
    下一代云端生產(chǎn)<b class='flag-5'>力</b>的核心特征與技術(shù)<b class='flag-5'>演進(jìn)</b>

    智能最具潛力的行業(yè)領(lǐng)域

    ?; 數(shù)據(jù)治理與聯(lián)合創(chuàng)新?:民生銀行與華為、阿里云等共建AI實(shí)驗(yàn)室,通過“數(shù)據(jù)湖+模型體系”提升服務(wù)精準(zhǔn)度?; 需求驅(qū)動(dòng)?:金融大模型推理對(duì)GPU
    的頭像 發(fā)表于 04-11 08:20 ?1012次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潛力的行業(yè)領(lǐng)域

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長(zhǎng)。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對(duì)
    發(fā)表于 03-25 12:00

    中心的如何衡量?

    作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施,其的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運(yùn)行。以下是對(duì)智中心算衡量的詳細(xì)闡述:一、
    的頭像 發(fā)表于 01-16 14:03 ?4100次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    科技云報(bào)到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?

    科技云報(bào)到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?
    的頭像 發(fā)表于 01-16 10:24 ?771次閱讀

    迅為瑞芯微RK3562開發(fā)板主頻2.0內(nèi)置NPU達(dá)1TOPS,核心板擴(kuò)展更多功能

    A53+Mali G52架構(gòu),主頻2GHZ,內(nèi)置1TOPSNPU,RK809動(dòng)態(tài)調(diào)頻。支持OpenGLES1.1/2.0/3.2、0penCL2.0、Vulkan 1.1內(nèi)嵌高性能
    發(fā)表于 12-24 15:07

    澎峰科技助力中國(guó)移動(dòng) 重磅發(fā)布智“芯合”原生基礎(chǔ)軟件棧2.0

    原生基礎(chǔ)軟件棧2.0。 芯片是智生態(tài)的基石,基礎(chǔ)軟件棧是智生態(tài)的核心。澎峰科技憑借在高性能計(jì)算庫和跨架構(gòu)領(lǐng)域的深厚積累,自
    的頭像 發(fā)表于 12-03 15:08 ?1035次閱讀
    澎峰科技助力中國(guó)移動(dòng) 重磅發(fā)布智<b class='flag-5'>算</b>“芯合”<b class='flag-5'>算</b><b class='flag-5'>力</b>原生基礎(chǔ)軟件棧<b class='flag-5'>2.0</b>

    澎峰科技助力中國(guó)移動(dòng)發(fā)布智“芯合”原生基礎(chǔ)軟件棧2.0

    近日 ,由中國(guó)通信學(xué)會(huì)主辦、中國(guó)移動(dòng)研究院承辦的2024中國(guó)信息通信大會(huì)“網(wǎng)絡(luò)網(wǎng)一體創(chuàng)新發(fā)展論壇 ”在成都召開。中國(guó)移動(dòng)研究院攜手澎峰科技等產(chǎn)業(yè)合作伙伴在本次論壇重磅發(fā)布了智
    的頭像 發(fā)表于 12-03 13:29 ?880次閱讀