chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

占用網(wǎng)絡(luò)是怎么讓自動駕駛識別異形障礙物的?

智駕最前沿 ? 來源:智駕最前沿 ? 2026-03-14 13:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]感知系統(tǒng)對于自動駕駛來說,就像是眼睛和翻譯官的角色。這套系統(tǒng)不僅要捕捉到周圍環(huán)境的光影信號,更需要將這些支離破碎的像素點轉(zhuǎn)化為計算機(jī)能夠理解的物理實體。

在過去很長一段時間里,行業(yè)內(nèi)主流的感知方案是基于目標(biāo)檢測的思維方式,也就是在三維空間中尋找特定的物體,并用一個緊湊的長方體框?qū)⑺鼈內(nèi)Χǔ鰜?。這種被稱為“3D目標(biāo)檢測”的方法在處理常見的汽車、行人和自行車時表現(xiàn)得非常高效,它能告訴車輛前方有一輛多少米長、多少米寬的小轎車。

然而,現(xiàn)實交通環(huán)境的復(fù)雜程度遠(yuǎn)超實驗室里預(yù)定義的標(biāo)簽庫。當(dāng)?shù)缆飞铣霈F(xiàn)一輛側(cè)翻的油罐車、一個散落的紙箱,或者是一個伸出吊臂的起重機(jī)時,傳統(tǒng)的畫框式算法就會顯得捉襟見肘,因為這些東西的形狀極不規(guī)則,很難用一個標(biāo)準(zhǔn)的方盒子去準(zhǔn)確描述。

為了解決這些“不在名單上”的風(fēng)險,占用網(wǎng)絡(luò)應(yīng)運(yùn)而生。它不再嘗試去辨認(rèn)每個物體的具體身份,而是將整個物理世界切分成無數(shù)個微小的、邊長通常只有十幾厘米的立方體,這些小方塊被稱為“體素”。

占用網(wǎng)絡(luò)只需要判斷每一個體素是否被物理實體所占據(jù)。這種從“物體檢測”到“空間占據(jù)預(yù)測”的邏輯轉(zhuǎn)變,讓自動駕駛系統(tǒng)具備了識別任何形狀障礙物的能力。

傳統(tǒng)視覺感知有何痛點?

在深入探討占用網(wǎng)絡(luò)之前,有必要先厘清下傳統(tǒng)感知方案在面對異形物體時的痛點。早期的自動駕駛算法高度依賴“分類”邏輯,也就是系統(tǒng)必須先知道一個東西是什么,才能確定它在哪。這種邏輯在處理“本體裂紋”或“語義裂縫”時非常脆弱。

舉個例子,如果一個算法的訓(xùn)練集里全都是標(biāo)準(zhǔn)的貨車,當(dāng)它在路上遇到一輛拉著長木材、木材向后延伸出車廂數(shù)米的拖掛車時,系統(tǒng)可能只會把車頭和車廂識別為一個長方體,而忽略掉那些向外延伸的木材。

對于自動駕駛汽車來說,這種對空間理解的缺失是非常致命的,因為這意味著規(guī)劃器可能會認(rèn)為車后方的空間是空的,從而在變道時發(fā)生碰撞。

此外,傳統(tǒng)3D目標(biāo)檢測還存在著形狀剛性的挑戰(zhàn)。它嘗試用一個長、寬、高固定的立方體去套住所有物體,但在現(xiàn)實中,很多障礙物是可變形的或者是中空的。

像是一輛正在施工的灑水車,它噴出的水霧在視覺上可能很模糊,或者一輛造型奇特的工程車,其吊臂懸浮在半空中。傳統(tǒng)的方盒子無法描述這種“懸空”或“非連續(xù)”的物理占據(jù),就會將吊臂下方的空地也標(biāo)記為不可通行,或者干脆完全漏掉懸空的吊臂。

這種對空間細(xì)節(jié)的粗糙處理,使得車輛在復(fù)雜的城市窄路或施工區(qū)域行駛時,表現(xiàn)得畏首畏尾或者極度危險。

視覺感知還有一個固有缺陷是深度信息的缺失。雖然我們可以通過算法將二維圖像轉(zhuǎn)化為三維坐標(biāo),但在遠(yuǎn)距離場景下,這種轉(zhuǎn)化的誤差會呈指數(shù)級增長。僅靠幾個像素點的變化來推斷地平線上一個物體的距離是非常不可靠的。激光雷達(dá)雖然能通過物理反射解決距離問題,但其成本限制了自動駕駛的大規(guī)模普及。

在這種背景下,如何用廉價的攝像頭實現(xiàn)媲美激光雷達(dá)的空間建模能力,成為了感知技術(shù)演進(jìn)的核心驅(qū)動力。占用網(wǎng)絡(luò)正是在這種需求下,通過將感知空間從二維平面提升到三維體素,為純視覺方案補(bǔ)齊了最后一塊短板。

占用網(wǎng)絡(luò)的是如何實現(xiàn)場景理解的?

占用網(wǎng)絡(luò)的核心理念是將車輛周圍的物理空間徹底“數(shù)字化”。它不再嘗試去理解具體的物體語義,而是將感知的焦點回歸到最原始的問題,這個點上到底有沒有東西。

為了實現(xiàn)這一點,系統(tǒng)會通過環(huán)視攝像頭捕獲360度的圖像數(shù)據(jù),然后利用特征提升,將這些二維的像素特征映射到一個三維的向量空間中。

在這個過程中,Transformer架構(gòu)起到了至關(guān)重要的作用。它像是一組敏銳的探測波,在三維空間中進(jìn)行“位置查詢”,通過注意力機(jī)制去尋找不同視角的圖像中哪些像素點指向了同一個物理空間點,從而在系統(tǒng)內(nèi)部構(gòu)建起一個密集的、充滿了特征信息的立體網(wǎng)格。

這種體素化的表示方法與傳統(tǒng)的點云數(shù)據(jù)有著異曲同工之妙,但它比點云更進(jìn)一步。點云僅僅是物體的表面反射點,而占用網(wǎng)絡(luò)生成的體素網(wǎng)格是連續(xù)的、稠密的。它不僅記錄了物體的表面,還隱含了空間的占據(jù)狀態(tài)。

poYBAGEgelqALvvfAAAAKvKtuzk094.gif

特斯拉的占用網(wǎng)絡(luò)可以在大約10毫秒內(nèi)完成一次全局的空間預(yù)測,這個速度遠(yuǎn)超人類的反應(yīng)極限。它會將世界劃分為一個個極小的立方體,并為每個立方體賦予一個“占據(jù)概率”。如果某個位置的占據(jù)概率超過了設(shè)定的閾值,規(guī)劃器就會將其視為障礙物,從而在路徑搜索中自動繞開該區(qū)域。

值得一提的是,占用網(wǎng)絡(luò)在提升空間分辨率方面也有一套精妙的算法。由于車載芯片的內(nèi)存和算力是有限的,系統(tǒng)不可能對所有的空間都進(jìn)行同樣精細(xì)的劃分。

因此,先進(jìn)的算法會采用“按需分配”的策略,在靠近車輛行駛路徑的區(qū)域,體素劃分得非常細(xì)致,足以看清路面上一個小小的路障;而在遠(yuǎn)離車輛或者天空中不影響行駛的區(qū)域,則使用較粗的網(wǎng)格以節(jié)省計算資源。

這種“分辨率在關(guān)鍵處發(fā)力”的設(shè)計,使得占用網(wǎng)絡(luò)能夠在實時性與準(zhǔn)確性之間找到完美的平衡點。

為了確保預(yù)測的準(zhǔn)確性,現(xiàn)代占用網(wǎng)絡(luò)還會引入時序融合機(jī)制。它不只是根據(jù)當(dāng)前的一幀畫面做判斷,還會參考過去幾十毫秒甚至幾百毫秒的特征流。這種跨時間的特征比對,不僅能過濾掉單幀圖像中可能出現(xiàn)的噪點,還能讓系統(tǒng)感知到物體是如何在三維空間中移動的。

這種時空的交織,讓車輛不僅擁有“立體感”,還擁有了某種程度上的“物理常識”。如當(dāng)系統(tǒng)看到一組體素正在向前快速移動時,它能通過歷史數(shù)據(jù)的一致性判斷出這大概率是一個動態(tài)的交通參與者,而不是路邊靜止的建筑殘骸。

占用網(wǎng)絡(luò)如何解決“看不見的風(fēng)險”?

占用網(wǎng)絡(luò)最引以為傲的能力,就是它對“長尾障礙物”或異形物體有極高魯棒性。在傳統(tǒng)的自動駕駛邏輯中,異形物體幾乎就是“無法識別”的。但是因為占用網(wǎng)絡(luò)本質(zhì)上是在做三維空間的幾何重構(gòu),它對物體的外觀、顏色或者類別完全不敏感。它只關(guān)心一點,如果在一個特定的空間坐標(biāo)上,攝像頭觀察到了持續(xù)的視覺遮擋和特征反饋,那么這個空間就是“被占據(jù)”的。

這就好比在黑夜中用手摸索前方的障礙。傳統(tǒng)算法像是必須通過手感猜出摸到的是椅子還是桌子才能避開,而占用網(wǎng)絡(luò)則只要發(fā)現(xiàn)手伸不過去,就立刻認(rèn)定那里有東西。

這種“幾何優(yōu)先”的思維方式徹底解決了語義裂縫問題。無論障礙物是一輛翻倒的灑水車、一堆凌亂的建筑材料,還是一棵橫在路中央的斷樹,占用網(wǎng)絡(luò)都能精準(zhǔn)地描繪出它們在三維空間中的實際輪廓,而不會像傳統(tǒng)算法那樣,試圖用長方體去強(qiáng)行套住這些形狀奇詭的東西。

此外,占用網(wǎng)絡(luò)對于處理“懸空障礙物”具有天然的優(yōu)勢。這是BEV(鳥瞰圖)技術(shù)在升維過程中最容易遺失的信息。在傳統(tǒng)的BEV架構(gòu)下,所有東西都被壓扁到了一個二維的地平面上,系統(tǒng)很難區(qū)分一個物體到底是長在地上,還是懸在空中。

而占用網(wǎng)絡(luò)通過在Z軸(高度軸)上的多層體素劃分,可以清晰地識別出路面上的隔離帶和橫跨路面的限高桿之間的空間差異。它能告訴車輛,底盤可以安全通過某些低矮的坑洼,但車頂可能會撞上前方低垂的樹枝。這種全方位的幾何理解,讓自動駕駛汽車在應(yīng)對復(fù)雜的施工現(xiàn)場或不規(guī)則的立交橋下空間時,具備類似人類駕駛員的直覺。

此外,占用網(wǎng)絡(luò)還具備卓越的“腦補(bǔ)”能力,這在處理遮擋問題時尤為關(guān)鍵。當(dāng)一輛大貨車遮擋住了后方的部分視野時,傳統(tǒng)的點云方案只能看到貨車的側(cè)面,而無法知道貨車后面是否還藏著其他東西。

占用網(wǎng)絡(luò)通過深度學(xué)習(xí)積累的幾何先驗,可以在一定程度上預(yù)測被遮擋區(qū)域的占據(jù)狀態(tài),并將這些預(yù)測信息提供給下游的避障算法。這種對未知空間的防御性建模,極大地提升了車輛在十字路口或視線受阻區(qū)域行駛時的安全性。

占用流如何實現(xiàn)預(yù)測能力?

如果說三維體素解決了空間識別的問題,那么“占用流”(Occupancy Flow)則賦予了系統(tǒng)對動態(tài)世界的預(yù)測能力。

占用流不僅能告訴我們哪些空間被占用了,還能給出每一個被占用體素的運(yùn)動矢量。通過分析這些矢量的顏色和方向,規(guī)劃算法可以清晰地預(yù)判周圍物體的運(yùn)動軌跡。

占用流的引入,本質(zhì)上是引入了物理世界的守恒定律。它意識到,一個體素如果現(xiàn)在被占據(jù)了,它下一刻要么留在原地,要么會移動到相鄰的體素位置。這種局部的連貫性約束,使得系統(tǒng)在處理行人鬼探頭、車輛緊急加塞等高風(fēng)險場景時,能夠比傳統(tǒng)基于目標(biāo)追蹤的方法更快地做出反應(yīng)。

系統(tǒng)不再需要經(jīng)歷“識別物體-關(guān)聯(lián)歷史幀-計算速度-生成預(yù)測軌跡”的長鏈條,而是直接觀察體素占據(jù)狀態(tài)的流轉(zhuǎn)趨勢。這種毫秒級的響應(yīng)速度提升,往往就是避免一場碰撞的關(guān)鍵。

在模型訓(xùn)練中,占用網(wǎng)絡(luò)也利用了許多前沿的技術(shù)手段來提升自身的進(jìn)化速度。由于人工標(biāo)注三維體素是一項幾乎不可能完成的任務(wù),行業(yè)內(nèi)普遍采用“NeRF(神經(jīng)輻射場)”等離線重建技術(shù)進(jìn)行自動標(biāo)注。

車輛在行駛過程中會通過眾包的形式收集海量的視覺數(shù)據(jù),在云端通過NeRF技術(shù)還原出極其真實的3D場景,并以此作為真值來訓(xùn)練車端的小模型。這種“云端重構(gòu)、車端預(yù)測”的閉環(huán),讓占用網(wǎng)絡(luò)能夠從全球數(shù)百萬輛車的日常行駛中不斷學(xué)習(xí),從而持續(xù)增強(qiáng)其泛化能力。

最后的話

占用網(wǎng)絡(luò)不僅是感知的終點,更是實現(xiàn)“端到端”自動駕駛的重要基石。當(dāng)感知系統(tǒng)輸出的是一幅連續(xù)的、帶有物理屬性的四維占用圖時,下游的規(guī)劃和控制模塊就可以尋找那些概率最低的空隙進(jìn)行穿梭。

這種深度的集成,消除了模塊間由于信息壓縮導(dǎo)致的誤差,讓自動駕駛汽車的行為變得更加擬人、更加流暢。雖然目前占用網(wǎng)絡(luò)還面臨著遠(yuǎn)距離精度不足、計算功耗高等挑戰(zhàn),但隨著車載算力的爆發(fā)和算法的迭代,這種讓萬物皆可被感知的技術(shù)方法,必將徹底重塑人類出行的安全標(biāo)準(zhǔn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7812

    瀏覽量

    93253
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8285

    瀏覽量

    95030
  • 自動駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14897

    瀏覽量

    180169
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    自動駕駛占用網(wǎng)絡(luò)是依靠哪個傳感器實現(xiàn)的?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛技術(shù)的演進(jìn)過程,本質(zhì)上是人類試圖賦予機(jī)器理解物理世界幾何結(jié)構(gòu)能力的過程。在過去很長一段時間里,感知系統(tǒng)高度依賴于對特定目標(biāo)的分類與識別,這種方式雖然在簡單的道路
    的頭像 發(fā)表于 03-13 08:56 ?387次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>占用</b><b class='flag-5'>網(wǎng)絡(luò)</b>是依靠哪個傳感器實現(xiàn)的?

    自動駕駛中常提的占用網(wǎng)絡(luò)檢測存在哪些問題?

    自動駕駛感知技術(shù)在過去幾年中經(jīng)歷了很大的變化,從最初的二維圖像檢測到鳥瞰圖投影,再到如今備受關(guān)注的占用網(wǎng)絡(luò),感知技術(shù)的提升,自動駕駛的能力
    的頭像 發(fā)表于 02-24 15:53 ?1024次閱讀

    自動駕駛端到端為什么會出現(xiàn)黑盒現(xiàn)象?

    自動駕駛領(lǐng)域,端到端(End-to-End)是指從感知環(huán)境的原始數(shù)據(jù)到車輛實際控制指令,全部交給一個統(tǒng)一的深度學(xué)習(xí)模型來完成。這和傳統(tǒng)的模塊化自動駕駛系統(tǒng)不一樣,模塊化自動駕駛系統(tǒng)會先識別
    的頭像 發(fā)表于 02-20 09:25 ?9337次閱讀
    <b class='flag-5'>自動駕駛</b>端到端為什么會出現(xiàn)黑盒現(xiàn)象?

    SLAM如何為自動駕駛提供空間感知能力?

    ,并精準(zhǔn)地判斷自己與障礙物的距離。這種看似本能的空間感知能力,在工程學(xué)領(lǐng)域被具象化為同步定位與地圖構(gòu)建技術(shù),即我們常說的SLAM。在自動駕駛的發(fā)展進(jìn)程中,SLAM不僅是車輛在未知環(huán)境中“生存”的技能,更是其實現(xiàn)厘米級高
    的頭像 發(fā)表于 02-09 09:12 ?438次閱讀
    SLAM如何為<b class='flag-5'>自動駕駛</b>提供空間感知能力?

    Transformer如何自動駕駛大模型獲得思考能力?

    在談及自動駕駛時,Transformer一直是非常關(guān)鍵的技術(shù),為何Transformer在自動駕駛行業(yè)一直被提及?
    的頭像 發(fā)表于 02-01 09:15 ?4225次閱讀

    占用網(wǎng)絡(luò)為什么自動駕駛感知更精準(zhǔn)?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛技術(shù)的演進(jìn)過程,本質(zhì)上是人類試圖賦予機(jī)器“理解物理世界幾何結(jié)構(gòu)”能力的過程。在過去很長一段時間里,感知系統(tǒng)高度依賴于對特定目標(biāo)的“分類與識別”。如果系統(tǒng)在訓(xùn)練
    的頭像 發(fā)表于 01-19 09:26 ?420次閱讀
    <b class='flag-5'>占用</b><b class='flag-5'>網(wǎng)絡(luò)</b>為什么<b class='flag-5'>讓</b><b class='flag-5'>自動駕駛</b>感知更精準(zhǔn)?

    自動駕駛汽車如何檢測石頭這樣的小障礙物?

    [首發(fā)于智駕最前沿微信公眾號]最近有一位小伙伴留言,想我聊聊自動駕駛汽車對于石頭這樣的小障礙物,是使用什么視覺任務(wù)檢測的。在直接回答“如何檢測”之前,其實要思考一個更根本的問題,對于一個像石頭這樣
    的頭像 發(fā)表于 12-24 16:53 ?1148次閱讀
    <b class='flag-5'>自動駕駛</b>汽車如何檢測石頭這樣的小<b class='flag-5'>障礙物</b>?

    自動駕駛中常提的GOD有什么作用?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛領(lǐng)域,“障礙物檢測”是一個非常重要且經(jīng)常會被提到的問題,在障礙物檢測領(lǐng)域,其實還有一個更細(xì)分的領(lǐng)域,那便是“通用障礙物檢測”(GOD,Gener
    的頭像 發(fā)表于 11-03 09:06 ?1552次閱讀
    <b class='flag-5'>自動駕駛</b>中常提的GOD有什么作用?

    自動駕駛汽車如何處理“鬼探頭”式的邊緣場景?

    、最可執(zhí)行的動作。這整個鏈條看起來簡單,但每一步都需要大量的技術(shù)支持。 自動駕駛汽車如何理解道路? 自動駕駛汽車想要精準(zhǔn)避開障礙物,首先是要“看見”障礙物。
    的頭像 發(fā)表于 08-29 11:11 ?809次閱讀
    <b class='flag-5'>自動駕駛</b>汽車如何處理“鬼探頭”式的邊緣場景?

    自動駕駛汽車如何準(zhǔn)確識別小物體?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛汽車想要在道路上安全行駛,需要識別的東西遠(yuǎn)比我們所知道的諸如紅綠燈、行人、車輛等復(fù)雜得多。其中有一個是我們經(jīng)常會忽略,但同樣非常重要的障礙物,那就是小物體,像是
    的頭像 發(fā)表于 08-22 09:11 ?679次閱讀
    <b class='flag-5'>自動駕駛</b>汽車如何準(zhǔn)確<b class='flag-5'>識別</b>小物體?

    Momenta飛輪大模型賦能輔助駕駛巧避障礙物

    城市道路瞬息萬變,每一秒都可能面臨新的挑戰(zhàn)。施工占道、前車急停、三角警示牌突現(xiàn)等復(fù)雜場景時刻考驗著駕駛員與車輛的應(yīng)對能力。Momenta飛輪大模型驅(qū)動的輔助駕駛系統(tǒng),能夠精準(zhǔn)避讓障礙物,
    的頭像 發(fā)表于 07-09 09:22 ?1030次閱讀

    自動駕駛汽車如何正確進(jìn)行道路識別

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛汽車在行駛過程中必須準(zhǔn)確識別道路環(huán)境,以便做出安全有效的決策,不同于人類開車,可以思考,自動駕駛汽車對于道路的識別需要更多的技術(shù)輔助。對于
    的頭像 發(fā)表于 06-29 09:40 ?1737次閱讀
    <b class='flag-5'>自動駕駛</b>汽車如何正確進(jìn)行道路<b class='flag-5'>識別</b>?

    卡車、礦車的自動駕駛和乘用車的自動駕駛在技術(shù)要求上有何不同?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛技術(shù)的發(fā)展,組合輔助駕駛得到大量應(yīng)用,但現(xiàn)在對于自動駕駛技術(shù)的宣傳,普遍是在乘用車領(lǐng)域,而對于卡車、礦車的
    的頭像 發(fā)表于 06-28 11:38 ?1472次閱讀
    卡車、礦車的<b class='flag-5'>自動駕駛</b>和乘用車的<b class='flag-5'>自動駕駛</b>在技術(shù)要求上有何不同?

    新能源車軟件單元測試深度解析:自動駕駛系統(tǒng)視角

    )和AI模塊(如激光雷達(dá)目標(biāo)檢測)。例如,在測試自動駕駛路徑規(guī)劃模塊時,可同步注入CAN總線信號(車速、轉(zhuǎn)向角)和虛擬點云數(shù)據(jù)(模擬障礙物),實現(xiàn)多維度耦合驗證。 ? 智能覆蓋率引導(dǎo): ? 通過
    發(fā)表于 05-12 15:59

    索尼FCB-EV9520L攝像頭:賦能自動駕駛新體驗

    具備出色的圖像捕捉能力。它擁有高分辨率的成像效果,能夠清晰呈現(xiàn)道路環(huán)境中的各種細(xì)節(jié),無論是交通標(biāo)識、車道線,還是遠(yuǎn)處的障礙物,都能精準(zhǔn)識別。這對于自動駕駛系統(tǒng)來說至關(guān)重要,因為只有準(zhǔn)確獲取周圍環(huán)境信息,才能做出正確的決策。例如,
    的頭像 發(fā)表于 05-09 11:51 ?622次閱讀