Av嫩草一级在线,2022精品222自偷自拍

[首發(fā)于智駕最前沿微信公眾號]在自動駕駛領(lǐng)域，“障礙物檢測”是一個非常重要且經(jīng)常會被提到的問題，在障礙物檢測領(lǐng)域，其實還有一個更細分的領(lǐng)域，那便是“通用障礙物檢測”（GOD，General Obstacle Detection）。之所以要研究GOD，是因為傳統(tǒng)的目標檢測系統(tǒng)一般只能識別如行人、車輛、自行車、交通錐等預(yù)先定義好的有限類別。

但真實真實交通場景中，經(jīng)常會出現(xiàn)像是掉落的貨箱、翻倒的圍欄、突然出現(xiàn)在車道上的大塊塑料布、動物、臨時擺放的工具箱、被雨水反光蓋住的塑料膜，甚至奇形怪狀的殘骸等各種意料之外的東西。這些東西在類別上會被定義為是“未知”的，但對于自動駕駛來說卻是實際存在且絕不能忽略的。

GOD的任務(wù)就是將障礙物檢測做到“通用”，其不僅要檢測已知類別的物體，還要盡可能識別出訓(xùn)練集中未出現(xiàn)過的異常物體，為后續(xù)的跟蹤、預(yù)測與規(guī)劃模塊提供關(guān)鍵的安全依據(jù)。

更簡單理解下，GOD不僅要判斷“那是行人”或“那是車輛”，還要在不同光照、天氣和速度條件下都能精準告訴你“前方有個實體，它會擋路或影響行駛安全”。這種能力在城市復(fù)雜路況、臨時施工路段、惡劣天氣等場景中尤為重要，因為自動駕駛不能僅依賴識別少數(shù)幾種固定標簽來保證安全，它必須對未知、罕見和危險情況保持高度敏感。

GOD是如何工作的？

GOD的輸入來源并不是單一的，最常見的輸入來源是攝像頭圖像和激光雷達點云，有時還會融合毫米波雷達或超聲波傳感器數(shù)據(jù)。攝像頭天然對語義和紋理敏感，激光雷達則能提供精確的三維幾何信息。

一個實用的GOD，其核心任務(wù)是將不同傳感器的信息融合，并輸出一組統(tǒng)一的“候選障礙物”。這些障礙物的表示形式可以是邊界框、分割掩碼，也可以是鳥瞰圖下的占據(jù)柵格。不僅如此，每個候選障礙物還會附帶一系列像是置信度（它真是障礙物的把握有多大）、速度估計（它移動得多快）、類別概率（如果能夠識別的話），以及不確定性評估（對上述所有判斷的可靠程度進行打分）等關(guān)鍵屬性。

部分GOD會沿用典型檢測架構(gòu)，先用卷積或Transformer提取特征，再通過檢測頭輸出邊界框和分類信息。與常規(guī)障礙物檢測不同的是，GOD更強調(diào)兩點，一是處理“開放集合”問題的能力，也就是能識別“我不知道這是什么，但它很重要”的物體；二是對小物體、透明物體、反光物體和部分遮擋物具有更強的魯棒性。為實現(xiàn)這些目標，很多方案中會引入異常檢測子模塊、輸出分割式掩碼、融合幾何一致性校驗（比如將激光雷達深度投影與相機檢測結(jié)果對比，不一致時提高關(guān)注等級）等技術(shù)。

對于GOD來說，時間維度非常關(guān)鍵。GOD不會僅憑單幀圖像就做出判斷，而是會結(jié)合時序信息來增強穩(wěn)定性，通過運動學(xué)一致性跟蹤，可以濾除臨時誤檢，也能維持被短暫遮擋但已出現(xiàn)在軌跡上的物體。

GOD的核心技術(shù)點與實現(xiàn)細節(jié)

GOD可基于傳統(tǒng)的一階段或兩階段檢測器實現(xiàn)，一階段檢測器（如基于錨框的RetinaNet，或無錨框的CenterNet、FCOS）直接預(yù)測目標位置與類別；兩階段檢測器（如Faster R-CNN系列）則是先生成候選區(qū)域，再對其進行精細分類與調(diào)整。近年來，Transformer架構(gòu)（如DETR及其系列模型）也被引入障礙物檢測領(lǐng)域，它能夠直接建模全局上下文關(guān)系，但在實際應(yīng)用中，仍需考慮計算成本與收斂速度。

在骨干網(wǎng)絡(luò)設(shè)計上，模型需兼顧性能與效率。對于視覺輸入，常采用ResNet、EfficientNet等經(jīng)典網(wǎng)絡(luò)提取特征，為適應(yīng)車規(guī)級芯片的算力限制，也會使用更輕量的MobileNet、GhostNet來實現(xiàn)。而對于激光雷達點云數(shù)據(jù)，常用的處理方法是基于體素的三維卷積、基于點直接處理的PointNet/PointNet++，或是采用近年來效率更高的稀疏卷積架構(gòu)。

圖片源自：網(wǎng)絡(luò)

GOD不僅要優(yōu)化目標定位和分類精度，還會引入專門的異常/新穎性損失，以提高對未見類別的敏感度。一些技術(shù)方案中會使用對比學(xué)習(xí)或自監(jiān)督預(yù)訓(xùn)練，幫助模型掌握“正常背景”的分布，從而更容易識別偏離分布的物體。還有一種思路就是將檢測任務(wù)拆為兩部分，常規(guī)的有限類別檢測使用交叉熵或Focal Loss等優(yōu)化，而“通用物體存在性”則通過自監(jiān)督異常分數(shù)或重建誤差來表示。

訓(xùn)練數(shù)據(jù)是決定效果的關(guān)鍵，要讓檢測器對各種“奇怪”的物體有感知能力，僅靠現(xiàn)有的行車數(shù)據(jù)集是不夠的，還需引入額外的稀有樣本、合成數(shù)據(jù)，或利用仿真環(huán)境生成的異常場景來擴展訓(xùn)練集。常用的數(shù)據(jù)增強手段包括隨機遮擋、顏色擾動、光照變化與幾何畸變等；還有更進階的做法就是將單幀圖像與激光雷達生成的稠密深度或鳥瞰投影結(jié)合，利用幾何一致性監(jiān)督提升對透明或反光物體的檢測能力。

聊了這么多技術(shù)細節(jié)，那GOD的實際效果會如何呢？傳統(tǒng)目標檢測是依賴mAP（平均精度）、精確率/召回率、IoU（交并比）等靜態(tài)指標進行評估的。但對于通用障礙物檢測（GOD），這些指標并不完全適用，其必須考量漏檢與誤報所帶來的實際風(fēng)險。如果漏檢一個車道上的箱子，就可能直接導(dǎo)致碰撞事故，而頻繁的誤報則會無故觸發(fā)緊急制動，這不僅會嚴重影響乘坐體驗，也會帶來不必要的跟車風(fēng)險。因此，GOD的評估體系必須超越靜態(tài)指標，納入如“安全臨界距離”或“碰撞時間”等體現(xiàn)實時威脅程度的動態(tài)因素。

GOD會有哪些挑戰(zhàn)？

將GOD應(yīng)用到實車上，其實會遇到很多現(xiàn)實問題。由于傳感器本身存在局限，相機在夜晚或逆光條件下性能會下降，激光雷達對透明物體（如玻璃、薄膜）不敏感，毫米波雷達對小物體分辨率低。這就需要不同傳感器之間互相補足。為了解決這個問題，比較穩(wěn)妥的做法是對不同傳感器的檢測結(jié)果進行融合判斷，如果相機識別到有明顯紋理但激光雷達沒有回波的物體，系統(tǒng)不會立即下結(jié)論，而是將其標記為“高不確定性”障礙物，交由跟蹤與規(guī)則模塊持續(xù)觀察。同時，系統(tǒng)也會結(jié)合場景上下文進行判斷，從而確保行車安全，像是在施工區(qū)域，就可以根據(jù)高精地圖或地理數(shù)據(jù)庫信息，提高對該區(qū)域的檢測敏感度。

由于真實的交通環(huán)境是開放的，且會存在很多的長尾問題，真實道路上的物體種類和形態(tài)變化一定會遠超訓(xùn)練集的覆蓋范圍。因此需要擴大訓(xùn)練集，對稀有場景進行標注和加強采樣；還要采用無監(jiān)督/自監(jiān)督方法建立“正常世界”模型，將任何偏離正常分布的物體視為潛在障礙；此外，還需借助元學(xué)習(xí)或少樣本學(xué)習(xí)，讓模型快速適應(yīng)新出現(xiàn)的類別。

車輛在高速行駛時，檢測模塊的延遲必須控制在幾十毫秒內(nèi)，而算力受限于車載計算平臺（往往是功耗和散熱受限的車規(guī)級SoC）。想讓GOD檢測正常，就需要做大量優(yōu)化工作，其實包括模型壓縮、量化、使用高效算子加速推理、將部分計算任務(wù)調(diào)度到專用加速器上，以及在系統(tǒng)層面進行優(yōu)先級管理（如將車道保持和前方最近障礙物檢測設(shè)為更高優(yōu)先級）等。降級策略的設(shè)計也是非常有必要的，當(dāng)計算資源緊張或傳感器異常時，系統(tǒng)應(yīng)能夠切換到如降低車速、增大安全車距，或交由遠程人工監(jiān)控等更保守但更可靠的感知/規(guī)劃模式。

一個合格的GOD系統(tǒng)不僅要在標準測試集上表現(xiàn)良好，還必須能夠應(yīng)對對抗攻擊（例如針對相機的貼紙干擾）、光學(xué)失真，以及部分傳感器失效等情況，并具備明確的降級處理機制。因此，要利用仿真場景進行大規(guī)模corner case測試，甚至將現(xiàn)實世界中出現(xiàn)的故障樣本回放到仿真環(huán)境中進行壓力驗證，從而確保魯棒性。

最后的話

GOD的目的是將一個開放的、無限可能的物理世界，與一個封閉的、由數(shù)據(jù)驅(qū)動的計算系統(tǒng)進行調(diào)和。它并不是一個靜態(tài)的模型，而是一個動態(tài)的、持續(xù)學(xué)習(xí)的“生態(tài)系統(tǒng)”。這個系統(tǒng)的效能，直接取決于它能否將現(xiàn)實世界中“未曾見過”的威脅，成功地轉(zhuǎn)化為算法可理解的“不確定性”或“異?！?。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴