chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

BEVFusion —面向自動(dòng)駕駛的多任務(wù)多傳感器高效融合框架技術(shù)詳解

eeDesigner ? 2025-02-26 20:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

BEVFusion 技術(shù)詳解總結(jié)

——面向自動(dòng)駕駛的多任務(wù)多傳感器高效融合框架

原始論文:*附件:bevfusion.pdf

介紹(Introduction)

背景:自動(dòng)駕駛系統(tǒng)配備了多種傳感器,提供互補(bǔ)的信號(hào)。但是不同傳感器的數(shù)據(jù)表現(xiàn)形式不同。

自動(dòng)駕駛系統(tǒng)配備了多樣的傳感器。 例如,Waymo的自動(dòng)駕駛車輛有29個(gè)攝像頭、6個(gè)雷達(dá)和5個(gè)激光雷達(dá)。 **不同的傳感器提供互補(bǔ)的信號(hào):**例如,攝像機(jī)捕捉豐富的語(yǔ)義信息,激光雷達(dá)提供精確的空間信息,而雷達(dá)提供即時(shí)的速度估計(jì)。 因此,多傳感器融合對(duì)于準(zhǔn)確可靠的感知具有重要意義。**來自不同傳感器的數(shù)據(jù)以根本不同的方式表示:**例如,攝像機(jī)在透視圖中捕獲數(shù)據(jù),激光雷達(dá)在3D視圖中捕獲數(shù)據(jù)。

圖片.png

1. 核心目標(biāo)與創(chuàng)新?

  • 目標(biāo)? 解決多模態(tài)傳感器(攝像頭、激光雷達(dá)等)在3D感知任務(wù)中的異構(gòu)數(shù)據(jù)融合難題,實(shí)現(xiàn)高效、通用的多任務(wù)學(xué)習(xí)(如3D檢測(cè)、BEV分割)
  • 核心創(chuàng)新?
    • ?統(tǒng)一BEV表示 將多模態(tài)特征映射到共享的鳥瞰圖(BEV)空間,保留幾何結(jié)構(gòu)(激光雷達(dá)優(yōu)勢(shì))和語(yǔ)義密度(攝像頭優(yōu)勢(shì))
    • ?優(yōu)化BEV池化 通過預(yù)計(jì)算和間隔縮減技術(shù),將BEV池化速度提升40%以上
    • ?全卷積融合 解決激光雷達(dá)與攝像頭BEV特征的空間錯(cuò)位問題,提升融合魯棒性

2. 技術(shù)框架與關(guān)鍵模塊?

圖片.png

?2.1 多模態(tài)特征提取

  • ?傳感器輸入
  • ?攝像頭 多視角圖像(透視視圖)
  • ?激光雷達(dá) 點(diǎn)云數(shù)據(jù)(3D視圖)
  • ?模態(tài)專用編碼器
  • ?攝像頭 2D卷積神經(jīng)網(wǎng)絡(luò)(如ResNet)提取圖像特征
  • ?激光雷達(dá) 3D稀疏卷積網(wǎng)絡(luò)(如VoxelNet)提取點(diǎn)云特征

?2.2 統(tǒng)一BEV表示構(gòu)建

  • ?攝像頭到BEV的轉(zhuǎn)換
  • ?深度分布預(yù)測(cè) 顯式預(yù)測(cè)每個(gè)像素的離散深度分布(避免幾何失真)
  • ?特征投影 沿相機(jī)射線將像素特征分散到離散3D點(diǎn),通過BEV池化聚合特征(見圖1)
  • ?優(yōu)化加速 預(yù)計(jì)算相機(jī)內(nèi)外參矩陣,減少實(shí)時(shí)計(jì)算開銷
  • ?激光雷達(dá)到BEV的轉(zhuǎn)換 直接通過體素化將點(diǎn)云映射到BEV網(wǎng)格

?2.3 全卷積特征融合

  • ?融合策略
  • ?通道級(jí)聯(lián) 將攝像頭和激光雷達(dá)的BEV特征拼接,輸入全卷積網(wǎng)絡(luò)(FCN)
  • ?空間對(duì)齊補(bǔ)償 通過可變形卷積或注意力機(jī)制緩解特征錯(cuò)位問題

?2.4 多任務(wù)頭設(shè)計(jì)

  • ?3D物體檢測(cè) 基于融合后的BEV特征,采用Anchor-free或CenterPoint范式預(yù)測(cè)邊界框
  • ?BEV地圖分割 全卷積解碼器輸出語(yǔ)義分割結(jié)果(如車道線、可行駛區(qū)域)

?3. 性能優(yōu)勢(shì)與實(shí)驗(yàn)驗(yàn)證

? 3.1 基準(zhǔn)測(cè)試結(jié)果(NuScenes數(shù)據(jù)集)

?任務(wù)?模型類型?性能指標(biāo)?BEVFusion優(yōu)勢(shì)
3D物體檢測(cè)純攝像頭模型mAP: 35.1%?mAP: 68.5%(+33.4%)
3D物體檢測(cè)純激光雷達(dá)模型mAP: 65.2%?mAP: 68.5%(+3.3%)
BEV地圖分割純攝像頭模型mIoU: 44.7%?mIoU: 50.7%(+6.0%)
BEV地圖分割純激光雷達(dá)模型mIoU: 37.1%?mIoU: 50.7%(+13.6%)

?3.2 效率對(duì)比

  • ?計(jì)算成本 BEVFusion的計(jì)算量?jī)H為同類多模態(tài)模型的50%(1.9倍低于純激光雷達(dá)模型)
  • ?推理速度 優(yōu)化后的BEV池化使端到端延遲降低40%
    圖片.png

?4. 與傳統(tǒng)方法的對(duì)比分析

?4.1 早期融合 vs. 晚期融合

?方法?優(yōu)勢(shì)?劣勢(shì)
早期融合(特征級(jí))保留原始數(shù)據(jù)信息異構(gòu)特征難以對(duì)齊(如幾何失真)
晚期融合(決策級(jí))模態(tài)獨(dú)立性高語(yǔ)義信息丟失,任務(wù)性能受限
?BEVFusion?統(tǒng)一BEV空間平衡幾何與語(yǔ)義需優(yōu)化特征對(duì)齊與計(jì)算效率

?4.2 其他多模態(tài)模型對(duì)比

  • ?PointPainting 將攝像頭語(yǔ)義注入點(diǎn)云,但依賴激光雷達(dá)主導(dǎo),無法充分發(fā)揮攝像頭優(yōu)勢(shì)
  • ?TransFusion 基于Transformer的融合,計(jì)算復(fù)雜度高,實(shí)時(shí)性差

?5. 局限性與未來方向

  • ?局限性
  • ?動(dòng)態(tài)場(chǎng)景適應(yīng)性 BEV靜態(tài)假設(shè)可能影響運(yùn)動(dòng)物體感知
  • ?傳感器依賴性 仍需激光雷達(dá)提供幾何先驗(yàn)
  • ?未來方向
  • ?純視覺BEV泛化 探索無激光雷達(dá)的BEV感知(如4D標(biāo)注數(shù)據(jù)增強(qiáng))
  • ?時(shí)序融合 引入多幀BEV特征提升動(dòng)態(tài)場(chǎng)景理解

?總結(jié)

BEVFusion通過統(tǒng)一的BEV表示空間和高效融合機(jī)制,解決了多模態(tài)傳感器在幾何與語(yǔ)義任務(wù)中的權(quán)衡問題,成為自動(dòng)駕駛多任務(wù)感知的標(biāo)桿框架其設(shè)計(jì)范式為后續(xù)研究提供了重要啟發(fā) ?**“統(tǒng)一表示+輕量?jī)?yōu)化”是多模態(tài)融合的核心方向**

項(xiàng)目鏈接

參考資料

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    792

    文章

    14790

    瀏覽量

    178236
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何設(shè)計(jì)自動(dòng)駕駛傳感器失效檢測(cè)與容錯(cuò)策略?

    對(duì)于自動(dòng)駕駛汽車而言,傳感器是它感知世界的窗口。攝像頭負(fù)責(zé)采集環(huán)境圖像,毫米波雷達(dá)和激光雷達(dá)則用于測(cè)量周圍物體的位置和速度,而GNSS(全球?qū)Ш叫l(wèi)星系統(tǒng))與慣性測(cè)量系統(tǒng)可提供車輛的定位信息。這些數(shù)據(jù)經(jīng)過融合處理之后,
    的頭像 發(fā)表于 01-10 10:33 ?2511次閱讀

    自動(dòng)駕駛BEV Camera數(shù)據(jù)采集:時(shí)間同步技術(shù)解析與康謀解決方案

    一、自動(dòng)駕駛傳感器融合中的時(shí)間同步重要性 在自動(dòng)駕駛感知體系中,BEV(Bird's-Eye-View,鳥瞰圖)感知技術(shù)憑借尺度變化小、視角
    的頭像 發(fā)表于 12-11 16:36 ?938次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>BEV Camera數(shù)據(jù)采集:時(shí)間同步<b class='flag-5'>技術(shù)</b>解析與康謀解決方案

    L4級(jí)自動(dòng)駕駛數(shù)據(jù)采集系統(tǒng)首選

    引言:自動(dòng)駕駛數(shù)據(jù)采集的核心挑戰(zhàn) 隨著L4級(jí)自動(dòng)駕駛技術(shù)進(jìn)入商業(yè)化落地階段,如何高效采集并處理海量
    的頭像 發(fā)表于 11-26 09:31 ?338次閱讀

    激光雷達(dá)傳感器自動(dòng)駕駛中的作用

    2024 年至 2030 年間,高度自動(dòng)化汽車每年的出貨量將以 41% 的復(fù)合年增長(zhǎng)率增長(zhǎng)。這種快速增長(zhǎng)導(dǎo)致汽車品牌對(duì)精確可靠傳感器技術(shù)的需求空前高漲,因?yàn)樗麄兿M峁┚珳?zhǔn)、可靠且最終完全自動(dòng)
    的頭像 發(fā)表于 10-17 10:06 ?3645次閱讀

    邊聊安全 | 以L3級(jí)自動(dòng)駕駛為例,詳解DDT、DDT Fallback、MRC、MRM概念

    以L3級(jí)自動(dòng)駕駛為例,詳解DDT、DDTFallback、MRC、MRM概念寫在前面:在自動(dòng)駕駛技術(shù)迅猛發(fā)展的今天,動(dòng)態(tài)駕駛
    的頭像 發(fā)表于 09-05 16:20 ?3565次閱讀
    邊聊安全 | 以L3級(jí)<b class='flag-5'>自動(dòng)駕駛</b>為例,<b class='flag-5'>詳解</b>DDT、DDT Fallback、MRC、MRM概念

    康謀分享 | 基于傳感器數(shù)據(jù)的自動(dòng)駕駛仿真確定性驗(yàn)證

    自動(dòng)駕駛仿真測(cè)試中,游戲引擎的底層架構(gòu)可能會(huì)帶來非確定性的問題,侵蝕測(cè)試可信度。如何通過專業(yè)仿真平臺(tái),在傳感器配置與極端天氣場(chǎng)景中實(shí)現(xiàn)測(cè)試數(shù)據(jù)零差異?確定性驗(yàn)證方案已成為自動(dòng)駕駛研發(fā)
    的頭像 發(fā)表于 07-02 13:17 ?4128次閱讀
    康謀分享 | 基于<b class='flag-5'>多</b><b class='flag-5'>傳感器</b>數(shù)據(jù)的<b class='flag-5'>自動(dòng)駕駛</b>仿真確定性驗(yàn)證

    自動(dòng)駕駛汽車是如何準(zhǔn)確定位的?

    厘米級(jí)的定位精度,并能夠?qū)崟r(shí)響應(yīng)環(huán)境變化。為此,自動(dòng)駕駛系統(tǒng)通常采用傳感器融合的方式,將全球?qū)Ш叫l(wèi)星系統(tǒng)(GNSS)、慣性測(cè)量單元(IMU)、激光雷達(dá)(LiDAR)、攝像頭、超寬帶(
    的頭像 發(fā)表于 06-28 11:42 ?1111次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>汽車是如何準(zhǔn)確定位的?

    自動(dòng)駕駛技術(shù)落地前為什么要先測(cè)試?

    大量的傳感器、復(fù)雜的算法和強(qiáng)大的計(jì)算平臺(tái)來取代人類駕駛員的感知、判斷和操作。在技術(shù)落地之前,“測(cè)試”便成了自動(dòng)駕駛從實(shí)驗(yàn)室走向真實(shí)道路的“安全閥”和“試金石”。如果沒有充分的測(cè)試,無論
    的頭像 發(fā)表于 06-09 09:42 ?639次閱讀

    Vicor高效電源模塊優(yōu)化自動(dòng)駕駛系統(tǒng)

    低壓(48V)自動(dòng)駕駛電動(dòng)穿梭車配備了先進(jìn)的自動(dòng)駕駛系統(tǒng),能夠在復(fù)雜的城市道路上自動(dòng)行駛。GPU 和傳感器自動(dòng)駕駛系統(tǒng)的關(guān)鍵組件,依賴高性
    的頭像 發(fā)表于 05-26 11:29 ?892次閱讀

    新能源車軟件單元測(cè)試深度解析:自動(dòng)駕駛系統(tǒng)視角

    、道路塌陷)的測(cè)試用例庫(kù),通過虛擬仿真和真實(shí)路測(cè)數(shù)據(jù)回灌驗(yàn)證算法的魯棒性。 ?第二部分:自動(dòng)駕駛軟件單元測(cè)試技術(shù)體系****? ?測(cè)試對(duì)象分類與測(cè)試策略? ? 數(shù)據(jù)驅(qū)動(dòng)型模塊(如傳感器融合
    發(fā)表于 05-12 15:59

    AI將如何改變自動(dòng)駕駛?

    自動(dòng)駕駛帶來哪些變化?其實(shí)AI可以改變自動(dòng)駕駛技術(shù)的各個(gè)環(huán)節(jié),從感知能力的提升到?jīng)Q策框架的優(yōu)化,從安全性能的增強(qiáng)到測(cè)試驗(yàn)證的加速,AI可以讓自動(dòng)駕駛
    的頭像 發(fā)表于 05-04 09:58 ?722次閱讀

    自動(dòng)駕駛大模型中常提的Token是個(gè)啥?對(duì)自動(dòng)駕駛有何影響?

    、模態(tài)傳感器數(shù)據(jù)的實(shí)時(shí)處理與決策。在這一過程中,大模型以其強(qiáng)大的特征提取、信息融合和預(yù)測(cè)能力為自動(dòng)駕駛系統(tǒng)提供了有力支持。而在大模型的中,有一個(gè)“Token”的概念,有些人看到后或許
    的頭像 發(fā)表于 03-28 09:16 ?1150次閱讀

    技術(shù)分享 |模態(tài)自動(dòng)駕駛混合渲染HRMAD:將NeRF和3DGS進(jìn)行感知驗(yàn)證和端到端AD測(cè)試

    模態(tài)自動(dòng)駕駛混合渲染HRMAD,融合NeRF與3DGS技術(shù),實(shí)現(xiàn)超10萬㎡場(chǎng)景重建,傳感器實(shí)
    的頭像 發(fā)表于 03-26 16:05 ?4082次閱讀
    <b class='flag-5'>技術(shù)</b>分享 |<b class='flag-5'>多</b>模態(tài)<b class='flag-5'>自動(dòng)駕駛</b>混合渲染HRMAD:將NeRF和3DGS進(jìn)行感知驗(yàn)證和端到端AD測(cè)試

    激光雷達(dá)技術(shù)自動(dòng)駕駛的應(yīng)用與發(fā)展趨勢(shì)

    隨著近些年科技不斷地創(chuàng)新,自動(dòng)駕駛技術(shù)正逐漸從概念走向現(xiàn)實(shí),成為汽車行業(yè)的重要發(fā)展方向。在眾多傳感器技術(shù)中,激光雷達(dá)(LiDAR)因其獨(dú)特的優(yōu)勢(shì),被認(rèn)為是實(shí)現(xiàn)高級(jí)
    的頭像 發(fā)表于 03-10 10:16 ?1521次閱讀
    激光雷達(dá)<b class='flag-5'>技術(shù)</b>:<b class='flag-5'>自動(dòng)駕駛</b>的應(yīng)用與發(fā)展趨勢(shì)

    自動(dòng)駕駛技術(shù)框架與行業(yè)前景解析

    形式,依舊有很多不同意見,其中不乏單車智能與智能網(wǎng)聯(lián)之爭(zhēng),也不乏激光雷達(dá)與車載攝像頭之間的討論,更有高精度地圖使用與否的歧義。 ? 智能駕駛概述 1.1智能駕駛的定義與發(fā)展背景 智能駕駛是指通過集成先進(jìn)的
    的頭像 發(fā)表于 02-05 14:44 ?1034次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>技術(shù)</b><b class='flag-5'>框架</b>與行業(yè)前景解析