chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛中常提的GOD有什么作用?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-11-03 09:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]在自動駕駛領(lǐng)域,“障礙物檢測”是一個非常重要且經(jīng)常會被提到的問題,在障礙物檢測領(lǐng)域,其實還有一個更細分的領(lǐng)域,那便是“通用障礙物檢測”(GOD,General Obstacle Detection)。之所以要研究GOD,是因為傳統(tǒng)的目標檢測系統(tǒng)一般只能識別如行人、車輛、自行車、交通錐等預(yù)先定義好的有限類別。

但真實真實交通場景中,經(jīng)常會出現(xiàn)像是掉落的貨箱、翻倒的圍欄、突然出現(xiàn)在車道上的大塊塑料布、動物、臨時擺放的工具箱、被雨水反光蓋住的塑料膜,甚至奇形怪狀的殘骸等各種意料之外的東西。這些東西在類別上會被定義為是“未知”的,但對于自動駕駛來說卻是實際存在且絕不能忽略的。

GOD的任務(wù)就是將障礙物檢測做到“通用”,其不僅要檢測已知類別的物體,還要盡可能識別出訓(xùn)練集中未出現(xiàn)過的異常物體,為后續(xù)的跟蹤、預(yù)測與規(guī)劃模塊提供關(guān)鍵的安全依據(jù)。

更簡單理解下,GOD不僅要判斷“那是行人”或“那是車輛”,還要在不同光照、天氣和速度條件下都能精準告訴你“前方有個實體,它會擋路或影響行駛安全”。這種能力在城市復(fù)雜路況、臨時施工路段、惡劣天氣等場景中尤為重要,因為自動駕駛不能僅依賴識別少數(shù)幾種固定標簽來保證安全,它必須對未知、罕見和危險情況保持高度敏感。

wKgZO2kH__yAPXDhAAAQo00DEvw427.jpg

GOD是如何工作的?

GOD的輸入來源并不是單一的,最常見的輸入來源是攝像頭圖像和激光雷達點云,有時還會融合毫米波雷達或超聲波傳感器數(shù)據(jù)。攝像頭天然對語義和紋理敏感,激光雷達則能提供精確的三維幾何信息。

一個實用的GOD,其核心任務(wù)是將不同傳感器的信息融合,并輸出一組統(tǒng)一的“候選障礙物”。這些障礙物的表示形式可以是邊界框、分割掩碼,也可以是鳥瞰圖下的占據(jù)柵格。不僅如此,每個候選障礙物還會附帶一系列像是置信度(它真是障礙物的把握有多大)、速度估計(它移動得多快)、類別概率(如果能夠識別的話),以及不確定性評估(對上述所有判斷的可靠程度進行打分)等關(guān)鍵屬性。

部分GOD會沿用典型檢測架構(gòu),先用卷積或Transformer提取特征,再通過檢測頭輸出邊界框和分類信息。與常規(guī)障礙物檢測不同的是,GOD更強調(diào)兩點,一是處理“開放集合”問題的能力,也就是能識別“我不知道這是什么,但它很重要”的物體;二是對小物體、透明物體、反光物體和部分遮擋物具有更強的魯棒性。為實現(xiàn)這些目標,很多方案中會引入異常檢測子模塊、輸出分割式掩碼、融合幾何一致性校驗(比如將激光雷達深度投影與相機檢測結(jié)果對比,不一致時提高關(guān)注等級)等技術(shù)。

對于GOD來說,時間維度非常關(guān)鍵。GOD不會僅憑單幀圖像就做出判斷,而是會結(jié)合時序信息來增強穩(wěn)定性,通過運動學(xué)一致性跟蹤,可以濾除臨時誤檢,也能維持被短暫遮擋但已出現(xiàn)在軌跡上的物體。

wKgZO2kH__2AFYA4AAAR42n7O-I917.jpg

GOD的核心技術(shù)點與實現(xiàn)細節(jié)

GOD可基于傳統(tǒng)的一階段或兩階段檢測器實現(xiàn),一階段檢測器(如基于錨框的RetinaNet,或無錨框的CenterNet、FCOS)直接預(yù)測目標位置與類別;兩階段檢測器(如Faster R-CNN系列)則是先生成候選區(qū)域,再對其進行精細分類與調(diào)整。近年來,Transformer架構(gòu)(如DETR及其系列模型)也被引入障礙物檢測領(lǐng)域,它能夠直接建模全局上下文關(guān)系,但在實際應(yīng)用中,仍需考慮計算成本與收斂速度。

在骨干網(wǎng)絡(luò)設(shè)計上,模型需兼顧性能與效率。對于視覺輸入,常采用ResNet、EfficientNet等經(jīng)典網(wǎng)絡(luò)提取特征,為適應(yīng)車規(guī)級芯片的算力限制,也會使用更輕量的MobileNet、GhostNet來實現(xiàn)。而對于激光雷達點云數(shù)據(jù),常用的處理方法是基于體素的三維卷積、基于點直接處理的PointNet/PointNet++,或是采用近年來效率更高的稀疏卷積架構(gòu)。

wKgZPGkH__2ALACNAACXhd71LJ8834.jpg

圖片源自:網(wǎng)絡(luò)

GOD不僅要優(yōu)化目標定位和分類精度,還會引入專門的異常/新穎性損失,以提高對未見類別的敏感度。一些技術(shù)方案中會使用對比學(xué)習(xí)或自監(jiān)督預(yù)訓(xùn)練,幫助模型掌握“正常背景”的分布,從而更容易識別偏離分布的物體。還有一種思路就是將檢測任務(wù)拆為兩部分,常規(guī)的有限類別檢測使用交叉熵或Focal Loss等優(yōu)化,而“通用物體存在性”則通過自監(jiān)督異常分數(shù)或重建誤差來表示。

訓(xùn)練數(shù)據(jù)是決定效果的關(guān)鍵,要讓檢測器對各種“奇怪”的物體有感知能力,僅靠現(xiàn)有的行車數(shù)據(jù)集是不夠的,還需引入額外的稀有樣本、合成數(shù)據(jù),或利用仿真環(huán)境生成的異常場景來擴展訓(xùn)練集。常用的數(shù)據(jù)增強手段包括隨機遮擋、顏色擾動、光照變化與幾何畸變等;還有更進階的做法就是將單幀圖像與激光雷達生成的稠密深度或鳥瞰投影結(jié)合,利用幾何一致性監(jiān)督提升對透明或反光物體的檢測能力。

聊了這么多技術(shù)細節(jié),那GOD的實際效果會如何呢?傳統(tǒng)目標檢測是依賴mAP(平均精度)、精確率/召回率、IoU(交并比)等靜態(tài)指標進行評估的。但對于通用障礙物檢測(GOD),這些指標并不完全適用,其必須考量漏檢與誤報所帶來的實際風(fēng)險。如果漏檢一個車道上的箱子,就可能直接導(dǎo)致碰撞事故,而頻繁的誤報則會無故觸發(fā)緊急制動,這不僅會嚴重影響乘坐體驗,也會帶來不必要的跟車風(fēng)險。因此,GOD的評估體系必須超越靜態(tài)指標,納入如“安全臨界距離”或“碰撞時間”等體現(xiàn)實時威脅程度的動態(tài)因素。

wKgZO2kH__2AGrwRAAASG3BOmsQ710.jpg

GOD會有哪些挑戰(zhàn)?

將GOD應(yīng)用到實車上,其實會遇到很多現(xiàn)實問題。由于傳感器本身存在局限,相機在夜晚或逆光條件下性能會下降,激光雷達對透明物體(如玻璃、薄膜)不敏感,毫米波雷達對小物體分辨率低。這就需要不同傳感器之間互相補足。為了解決這個問題,比較穩(wěn)妥的做法是對不同傳感器的檢測結(jié)果進行融合判斷,如果相機識別到有明顯紋理但激光雷達沒有回波的物體,系統(tǒng)不會立即下結(jié)論,而是將其標記為“高不確定性”障礙物,交由跟蹤與規(guī)則模塊持續(xù)觀察。同時,系統(tǒng)也會結(jié)合場景上下文進行判斷,從而確保行車安全,像是在施工區(qū)域,就可以根據(jù)高精地圖或地理數(shù)據(jù)庫信息,提高對該區(qū)域的檢測敏感度。

由于真實的交通環(huán)境是開放的,且會存在很多的長尾問題,真實道路上的物體種類和形態(tài)變化一定會遠超訓(xùn)練集的覆蓋范圍。因此需要擴大訓(xùn)練集,對稀有場景進行標注和加強采樣;還要采用無監(jiān)督/自監(jiān)督方法建立“正常世界”模型,將任何偏離正常分布的物體視為潛在障礙;此外,還需借助元學(xué)習(xí)或少樣本學(xué)習(xí),讓模型快速適應(yīng)新出現(xiàn)的類別。

車輛在高速行駛時,檢測模塊的延遲必須控制在幾十毫秒內(nèi),而算力受限于車載計算平臺(往往是功耗和散熱受限的車規(guī)級SoC)。想讓GOD檢測正常,就需要做大量優(yōu)化工作,其實包括模型壓縮、量化、使用高效算子加速推理、將部分計算任務(wù)調(diào)度到專用加速器上,以及在系統(tǒng)層面進行優(yōu)先級管理(如將車道保持和前方最近障礙物檢測設(shè)為更高優(yōu)先級)等。降級策略的設(shè)計也是非常有必要的,當(dāng)計算資源緊張或傳感器異常時,系統(tǒng)應(yīng)能夠切換到如降低車速、增大安全車距,或交由遠程人工監(jiān)控等更保守但更可靠的感知/規(guī)劃模式。

一個合格的GOD系統(tǒng)不僅要在標準測試集上表現(xiàn)良好,還必須能夠應(yīng)對對抗攻擊(例如針對相機的貼紙干擾)、光學(xué)失真,以及部分傳感器失效等情況,并具備明確的降級處理機制。因此,要利用仿真場景進行大規(guī)模corner case測試,甚至將現(xiàn)實世界中出現(xiàn)的故障樣本回放到仿真環(huán)境中進行壓力驗證,從而確保魯棒性。

wKgZO2kH__6ALjclAAASAJELks8749.jpg

最后的話

GOD的目的是將一個開放的、無限可能的物理世界,與一個封閉的、由數(shù)據(jù)驅(qū)動的計算系統(tǒng)進行調(diào)和。它并不是一個靜態(tài)的模型,而是一個動態(tài)的、持續(xù)學(xué)習(xí)的“生態(tài)系統(tǒng)”。這個系統(tǒng)的效能,直接取決于它能否將現(xiàn)實世界中“未曾見過”的威脅,成功地轉(zhuǎn)化為算法可理解的“不確定性”或“異?!?。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14920

    瀏覽量

    180411
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    自動駕駛中常的占用網(wǎng)絡(luò)檢測存在哪些問題?

    自動駕駛感知技術(shù)在過去幾年中經(jīng)歷了很大的變化,從最初的二維圖像檢測到鳥瞰圖投影,再到如今備受關(guān)注的占用網(wǎng)絡(luò),感知技術(shù)的提升,讓自動駕駛的能力越來越強。
    的頭像 發(fā)表于 02-24 15:53 ?1066次閱讀

    自動駕駛中常的離線強化學(xué)習(xí)是什么?

    [首發(fā)于智駕最前沿微信公眾號]在之前談及自動駕駛模型學(xué)習(xí)時,詳細聊過強化學(xué)習(xí)的作用,由于強化學(xué)習(xí)能讓大模型通過交互學(xué)到策略,不需要固定的規(guī)則,從而給自動駕駛的落地創(chuàng)造了更多可能。 強化學(xué)習(xí)示意圖
    的頭像 發(fā)表于 02-07 09:21 ?252次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的離線強化學(xué)習(xí)是什么?

    自動駕駛中常的模仿學(xué)習(xí)是什么?

    當(dāng)談及自動駕駛模型學(xué)習(xí)時,經(jīng)常會提到模仿學(xué)習(xí)的概念。所謂模仿學(xué)習(xí),就是模型先看別人怎么做,然后學(xué)著去做。自動駕駛中的模仿學(xué)習(xí),就是把人類司機在各種路況下的行為做成范例,記錄下看到了什么和做了什么等信息,然后將這些一一對應(yīng)起來當(dāng)作訓(xùn)練數(shù)據(jù),并訓(xùn)練出一個模型。
    的頭像 發(fā)表于 01-16 16:41 ?2033次閱讀

    自動駕駛中常的世界模型是什么?

    在很多廠家的技術(shù)方案中,會提到世界模型的介紹。世界模型,就是自動駕駛系統(tǒng)內(nèi)部用來表示外部世界并預(yù)測未來演變的一組模型或表征。換句話說,世界模型就是把傳感器看到的東西(攝像頭畫面、激光雷達點云、雷達
    的頭像 發(fā)表于 01-05 16:23 ?950次閱讀

    大模型中常的快慢思考會對自動駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺語言模型和世界模型的全新自動駕駛技術(shù)架構(gòu)標志著其全棧自研的智能駕駛研發(fā)進入了新階段。該架構(gòu)的算法原型創(chuàng)新性地受到了諾貝爾獎得主丹尼爾·卡尼曼
    的頭像 發(fā)表于 11-22 10:59 ?2549次閱讀
    大模型<b class='flag-5'>中常</b><b class='flag-5'>提</b>的快慢思考會對<b class='flag-5'>自動駕駛</b>產(chǎn)生什么影響?

    自動駕駛中常的“專家數(shù)據(jù)”是個啥?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,經(jīng)常會聽到一個概念,那便是“專家數(shù)據(jù)”。專家數(shù)據(jù),說白了就是“按理應(yīng)該這么做”的那類示范數(shù)據(jù)。它不是隨機抓來的日志,也不是隨便標注的標簽,而是來源可靠
    的頭像 發(fā)表于 10-09 09:33 ?744次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“專家數(shù)據(jù)”是個啥?

    自動駕駛中常的ODD是個啥?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛中,經(jīng)常會聽到一個概念,那就是ODD。所謂ODD,全稱為Operational Design Domain,中文常譯為“運行設(shè)計域”或者“作業(yè)域”。直觀一點
    的頭像 發(fā)表于 09-22 09:04 ?955次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的ODD是個啥?

    自動駕駛中常的“全棧”是個啥?必要“全?!眴幔?/a>

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)落地,越來越多車企公布了自己的自動駕駛方案,在很多車企的宣傳中,會使用“全棧自研”的說法來證明自己的實力。所謂“全?!保置嬉馑际侨准夹g(shù)棧的自主開發(fā)
    的頭像 發(fā)表于 08-27 09:43 ?1206次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“全?!笔莻€啥?<b class='flag-5'>有</b>必要“全?!眴幔? />    </a>
</div>                              <div   id=

    自動駕駛中常的硬件在環(huán)是個啥?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛技術(shù)時,經(jīng)常會提及一個技術(shù),那就是硬件在環(huán),所謂的硬件在環(huán)是個啥?對于自動駕駛來說作用?今天智駕最前沿就帶大家來聊聊這一技術(shù)。 所謂硬件
    的頭像 發(fā)表于 08-14 08:54 ?1320次閱讀

    自動駕駛中常的慣性導(dǎo)航系統(tǒng)是個啥?可以不用嗎?

    每次提到自動駕駛硬件時,大家可能第一反應(yīng)想到的是激光雷達、車載攝像頭、毫米波雷達等,但想要讓自動駕駛車輛實際落地,一個硬件也非常重要,那就是慣性導(dǎo)航系統(tǒng)。在很多討論自動駕駛技術(shù)的內(nèi)容
    的頭像 發(fā)表于 07-24 18:12 ?2013次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的慣性導(dǎo)航系統(tǒng)是個啥?可以不用嗎?

    自動駕駛中常的“時序”是個啥?作用?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛技術(shù)的發(fā)展,不僅依賴于感知算法的精度和決策規(guī)劃的智能,還深深植根于系統(tǒng)內(nèi)部對“時序”這一概念的精準把控。所謂時序,簡單來講,就是系統(tǒng)在不同模塊之間、不同傳感器
    的頭像 發(fā)表于 07-17 09:07 ?1118次閱讀

    自動駕駛中常的世界模型是個啥?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的不斷成熟,車輛需要在復(fù)雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見”周圍的世界,還要能“理解”和“推測”未來的變化。世界模型可以被看作一種
    的頭像 發(fā)表于 06-24 08:53 ?1217次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的世界模型是個啥?

    自動駕駛中常的“點云”是個啥?

    啥?對自動駕駛何影響? 點云是個啥? 點云(Point Cloud)是一種在三維空間中由大量離散點組成的數(shù)據(jù)集合,每個點包含自身的笛卡爾坐標(X、Y、Z),并可附帶顏色、強度、時間戳等屬性,用于描述物體的空間分布和表面特性。在
    的頭像 發(fā)表于 05-21 09:04 ?1242次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“點云”是個啥?

    自動駕駛中常的“NOA”是個啥?

    近年來,自動駕駛技術(shù)發(fā)展迅速,業(yè)界不斷探索如何在復(fù)雜交通場景中實現(xiàn)真正的無人駕駛。城市NOA作為自動駕駛的一項前沿技術(shù),正成為各大廠商相互爭奪的關(guān)鍵技術(shù)。 何為NOA? NOA,全稱
    的頭像 發(fā)表于 04-09 09:03 ?3248次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“NOA”是個啥?

    自動駕駛大模型中常的Token是個啥?對自動駕駛何影響?

    、多模態(tài)傳感器數(shù)據(jù)的實時處理與決策。在這一過程中,大模型以其強大的特征提取、信息融合和預(yù)測能力為自動駕駛系統(tǒng)提供了有力支持。而在大模型的中,一個“Token”的概念,有些人看到后或許會問: Token是個啥?對自動駕駛
    的頭像 發(fā)表于 03-28 09:16 ?1420次閱讀