chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛汽車能夠識別出交警指揮手勢嗎?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2026-01-26 09:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]在高度復(fù)雜的城市交通網(wǎng)絡(luò)中,行駛規(guī)則并不是一成不變的。雖然交通信號燈、地面標(biāo)線和各類指示牌可以構(gòu)成道路運(yùn)行的基礎(chǔ)框架,但在交通事故處理、電力故障導(dǎo)致信號燈失效以及極端交通擁堵等特殊場景下,交警就會介入并接管交通指揮權(quán)。對于人類駕駛員而言,識別交警的手勢并遵從其指令是一種本能反應(yīng),但對于自動駕駛系統(tǒng)來說,這其中包含了感知、理解與決策領(lǐng)域的多項(xiàng)技術(shù)。

wKgZO2l2wXaALIZOAAAQo00DEvw166.jpg

自動駕駛汽車如何理解人體姿態(tài)?

自動駕駛車輛識別交警手勢的第一步始于對環(huán)境的精細(xì)感知。在早期的計算機(jī)視覺方案中,自動駕駛系統(tǒng)主要通過剛性的“邊界框”來定位物體。這種方法可以將交警從復(fù)雜的背景中框選出來,識別其為一個“人”,但這種粗顆粒度的識別無法捕獲關(guān)鍵的指揮信息。為了解決這一問題,自動駕駛系統(tǒng)引入了人體姿態(tài)估計技術(shù)。這種技術(shù)不再將交警視為一個整體,而是通過提取其肩膀、肘部、手腕、髖部以及腳踝等全身的關(guān)鍵點(diǎn),構(gòu)建出一個精細(xì)的生物力學(xué)骨架模型。

為了實(shí)現(xiàn)這一目標(biāo),需要車輛搭載的多個傳感器相互協(xié)同。攝像頭作為視覺核心,負(fù)責(zé)捕捉色彩和紋理信息,可以用來識別交警的制服特征、反光背心的樣式以及手部的細(xì)微動作。攝像頭在強(qiáng)光直射、黑夜或雨雪天氣下容易出現(xiàn)感知退化。此時,激光雷達(dá)可以向外發(fā)射激光脈沖并接收反射點(diǎn)云,為系統(tǒng)提供一個具有精確深度信息的三維世界模型。即使在昏暗的環(huán)境下,激光雷達(dá)也能勾勒出交警手臂擺動的空間軌跡。毫米波雷達(dá)則可以實(shí)時監(jiān)測交警身體運(yùn)動的多普勒頻率變化,從而感知交警動作的爆發(fā)力和節(jié)奏感。這種多模態(tài)的數(shù)據(jù)融合,讓自動駕駛系統(tǒng)能夠建立一個超越人類肉眼的、具備全天候能力的數(shù)字視界。

為了提高識別的可靠性,自動駕駛系統(tǒng)需要對交警的身份進(jìn)行確認(rèn)。在交通環(huán)境中,并不是所有人的揮手動作都具有指揮意義,像是路邊招手的行人、正在施工的環(huán)衛(wèi)工或者是普通路人的肢體語言對于自動駕駛汽車來說,其實(shí)是沒有參考需要的。因此,感知層需通過卷積神經(jīng)網(wǎng)絡(luò)(CNN)對目標(biāo)進(jìn)行精細(xì)分類,確認(rèn)其是否穿著特定制服或持有指揮棒。

一旦系統(tǒng)確認(rèn)了交警,后續(xù)的計算資源將集中于該目標(biāo)的姿態(tài)變化。目前的MoveNet或MediaPipe等算法,能夠在極低的計算延遲下提取人體的關(guān)鍵點(diǎn),這對于在時速幾十公里的行駛過程中做出瞬時判斷至關(guān)重要。

在處理復(fù)雜的手部動作時,手套的顏色、手部被身體其他部位遮擋或者是交警側(cè)身對向車輛,都是感知算法必須面對的問題。為了增強(qiáng)魯棒性,有技術(shù)提出了三維手部模型,通過對關(guān)鍵幀的深度學(xué)習(xí),自動駕駛系統(tǒng)能夠推斷出被遮擋部位的可能姿態(tài)。像是Waymo的感知系統(tǒng)就能夠在繁忙的路口同時追蹤上百個行人的動態(tài),并從中篩選出對車輛行駛有直接影響的指揮信號。這種從整體到局部的分層式識別架構(gòu),構(gòu)成了自動駕駛系統(tǒng)理解人類指揮的第一道技術(shù)屏障。

傳感器類型 在手勢識別中的核心貢獻(xiàn) 技術(shù)局限性與挑戰(zhàn)
高清攝像頭(RGB) 提供顏色、紋理、制服識別、手勢細(xì)節(jié)捕捉 易受光照(過曝/過暗)、霧霾、雨雪干擾
激光雷達(dá)(LiDAR) 建立3D骨架、精確的深度測量、不受光照影響 分辨率相對較低,難以識別紡織品紋理或色彩
毫米波雷達(dá) 捕獲肢體運(yùn)動速度、對動態(tài)特征敏感、全天候運(yùn)行 無法提供精細(xì)形狀信息,容易產(chǎn)生背景噪聲干擾
外部音頻接收器 捕獲交警哨聲、擴(kuò)音器指令(輔助判別) 易受城市背景噪音干擾,定位精度有待提高

wKgZO2l2wXeAXgDfAAAR42n7O-I645.jpg

時間序列建模與手勢語義的動態(tài)解析邏輯

對于自動駕駛汽車來說,僅捕捉到一瞬間的姿態(tài)并不能代表理解了指令,因?yàn)榻煌ㄖ笓]是一個連續(xù)的動作序列。一個完整的“停止”指令可能包括抬起手臂、掌心向外、并保持一定的僵直度;而“左轉(zhuǎn)”指令則包含指向車輛、劃過胸前、并指向側(cè)方的一系列軌跡。因此,手勢識別本質(zhì)上是一個視頻分類和動作理解的過程,需要自動駕駛系統(tǒng)具備處理“時間相關(guān)性”的能力。

為了能夠?qū)崿F(xiàn)這種時間記憶,自動駕駛系統(tǒng)可采用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及其改進(jìn)型架構(gòu),像是長短期記憶網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元(GRU)等就屬于這一類架構(gòu)。這些網(wǎng)絡(luò)結(jié)構(gòu)在處理每一幀圖像時,都可以保留前一時刻的信息狀態(tài)。這種“記憶”機(jī)制允許模型將過去幾十幀中手臂的運(yùn)動方向串聯(lián)起來,從而識別出動作的語義。舉個例子,當(dāng)系統(tǒng)觀測到交警的手臂從低位向高位平滑移動時,它不會簡單地將其判定為一次“位移”,而是將其解讀為“起步”手勢的前奏。

為了提高對指揮手勢判斷的準(zhǔn)確性,可采用“標(biāo)志位序列算法”的機(jī)制。該機(jī)制可同時監(jiān)測交警的身體朝向、視線焦點(diǎn)以及手臂軌跡。當(dāng)交警的目光注視著本車,且手臂做出了針對性的導(dǎo)流動作時,自動駕駛系統(tǒng)會將該序列標(biāo)記為“有效指令”。這種邏輯能有效過濾掉那些交警正在指揮側(cè)向交通或者是正在整理裝備的無效動作。

為了進(jìn)一步壓低系統(tǒng)延遲,還有技術(shù)提出了“無骨架”的手勢識別路徑。這種方法不再耗費(fèi)計算資源去精準(zhǔn)定位每一個手指關(guān)節(jié),而是直接通過訓(xùn)練好的輕量級檢測器識別手臂的整體指向矢量,并將其映射到一個預(yù)定義的指令集合中。這種方法在保持高達(dá)91%以上準(zhǔn)確率的同時,還顯著提升了每秒處理幀數(shù)(FPS),使得車輛在高速運(yùn)動中也能實(shí)時解析出交警的最新意圖。這種從“精細(xì)建?!钡健罢Z義映射”的轉(zhuǎn)變,也體現(xiàn)出自動駕駛在效率與精度之間的權(quán)衡。

數(shù)據(jù)質(zhì)量是訓(xùn)練這些復(fù)雜模型的關(guān)鍵。Waymo等公司利用其龐大的路測數(shù)據(jù)庫,通過“內(nèi)容搜索”技術(shù)提取出數(shù)百萬個包含交警指揮的真實(shí)片段。這些數(shù)據(jù)被用于訓(xùn)練具備多層深度的神經(jīng)網(wǎng)絡(luò),使其能夠理解不同國家、不同文化背景下指揮習(xí)慣的微小差異。

wKgZO2l2wXiASEG0AAASG3BOmsQ025.jpg

端到端架構(gòu)與大模型驅(qū)動的物理世界理解

隨著人工智能領(lǐng)域進(jìn)入大模型時代,自動駕駛系統(tǒng)識別交警手勢的技術(shù)路線也正在經(jīng)歷變革。傳統(tǒng)的感知系統(tǒng)是模塊化的,視覺算法輸出坐標(biāo),邏輯算法輸出語義,規(guī)劃算法輸出指令。這種鏈條式的結(jié)構(gòu)雖然清晰,但在處理高度抽象、充滿不確定性的人類行為時,會因?yàn)楦鲗又g的信息損耗而顯得生硬。像是VLA(視覺-語言-動作)大模型,則嘗試將這些層級打通,構(gòu)建一種“端到端”的直接映射能力。

在這種全新的架構(gòu)中,交警的手勢不再被簡化為一個“停車”或“通行”的標(biāo)簽。相反,系統(tǒng)會將攝取的視頻流轉(zhuǎn)化為一種隱式的“物理標(biāo)記”,這些標(biāo)記將直接輸入到一個擁有數(shù)十億參數(shù)的大模型中。該模型不僅學(xué)習(xí)過如何開車,還閱讀過海量的交通法規(guī),并觀看過無數(shù)人類在路口交互的視頻。因此,當(dāng)模型看到交警舉起手時,它就會直接輸出對物理世界規(guī)則的直覺反應(yīng),做出停車的動作。這種方式讓車輛的決策更加擬人化,能夠處理那些未經(jīng)預(yù)設(shè)的復(fù)雜場景。

大模型技術(shù)的另一個核心優(yōu)勢在于其強(qiáng)大的“零樣本”或“少樣本”泛化能力。這意味著即便自動駕駛系統(tǒng)在訓(xùn)練中從未見過某種極其罕見的交通引導(dǎo)員服飾,它也能憑借對“人”和“指揮動作”的深層理解,推斷出對方的指揮意圖。像是在施工地段,一名身穿便服但手持臨時導(dǎo)流旗幟的工人,其發(fā)出的信號同樣需要被識別。傳統(tǒng)系統(tǒng)可能因?yàn)槟繕?biāo)不符合“穿著的制服”特征而被忽略,但基于VLA架構(gòu)的物理世界模型可以通過周圍的錐桶、停滯的車流以及工人的視線等上下文,綜合判斷該信號的合法性。

wKgZPGl2wXiAWJAlAAED49g2b6A467.jpg

圖片源自:網(wǎng)絡(luò)

如何將這種擁有龐大參數(shù)的大模型安裝在有限算力的車載芯片上也是一個巨大的挑戰(zhàn)。為了實(shí)現(xiàn)這一目標(biāo),自動駕駛廠商采用了“模型蒸餾”和“剪枝”技術(shù)。這就像是將一本百科全書壓縮成一本實(shí)用的駕駛手冊,在云端,自動駕駛系統(tǒng)使用超大規(guī)模的模型進(jìn)行深度學(xué)習(xí),捕獲最細(xì)微的交通特征;隨后,通過蒸餾算法,將這些知識遷移到參數(shù)量較小但效率極高的車載模型中。此外,諸如FastDriveVLA之類的創(chuàng)新框架,通過“視覺標(biāo)記剪枝”技術(shù),可以讓模型在每一幀圖像中只關(guān)注那些真正重要的信息(如交警的手臂、面部和周圍的障礙物),并忽略背景中無關(guān)的建筑,從而在保持高精度的同時,將計算負(fù)荷降低數(shù)倍。

wKgZO2l2wXiAXzuEAAASAJELks8598.jpg

決策仲裁系統(tǒng)與復(fù)雜路口的協(xié)同控制策略

當(dāng)感知系統(tǒng)確認(rèn)了交警的指令,大模型解析了語義之后,自動駕駛系統(tǒng)便進(jìn)入了最具挑戰(zhàn)性的環(huán)節(jié),即決策執(zhí)行。在一個路口,車輛可能同時接收到多個互相矛盾的信息源,高清地圖顯示這里是直行車道,交通信號燈正亮著紅燈,但交警卻揮手示意你可以通過。在這種情況下,自動駕駛系統(tǒng)的內(nèi)部仲裁邏輯必須做出準(zhǔn)確判斷。根據(jù)現(xiàn)行的交通法規(guī),交警的指揮權(quán)始終高于靜態(tài)的信號系統(tǒng)和預(yù)設(shè)的規(guī)則。

為了實(shí)現(xiàn)這種高優(yōu)先級的接管,自動駕駛系統(tǒng)的決策層會采用一種“分層控制架構(gòu)”。頂層是基于交警指令的臨時規(guī)控器,一旦手勢識別模塊確認(rèn)了合法的通行信號,它就會向底層的路徑規(guī)劃器發(fā)送一個覆蓋請求。這個請求會暫時讓紅綠燈的約束條件失效,并根據(jù)交警指引的方向生成一條臨時的軌跡線。譬如,在左轉(zhuǎn)彎受到交警引導(dǎo)時,車輛會自動調(diào)整其轉(zhuǎn)彎半徑,并避開交警劃定的禁行區(qū)域。這一過程需要極其精密的時空同步,因?yàn)榻痪闹噶羁赡苁撬蚕⑷f變的,系統(tǒng)必須在毫秒級時間內(nèi)重新計算最優(yōu)軌跡。

安全性始終是自動駕駛決策的核心。如果自動駕駛系統(tǒng)識別到了交警在揮手,但無法解析出確切的語義,它應(yīng)采取“保守響應(yīng)”策略。在這種不確定性較高的場景下,車輛需請求人類駕駛員接管;對于Robotaxi的無人駕駛汽車,則需緩慢減速并在安全位置停車,同時需向云端調(diào)度中心發(fā)起遠(yuǎn)程協(xié)助請求,由人類遠(yuǎn)程安全員來執(zhí)行下一步動作。這種“人機(jī)協(xié)作”的冗余機(jī)制,是確保自動駕駛車輛在復(fù)雜社會環(huán)境中不引發(fā)二次事故的關(guān)鍵支撐。

wKgZO2l2wXmAJCthAAARwcz1hbg076.jpg

最后的話

自動駕駛系統(tǒng)識別交警手勢并不只是一個視覺問題,從最初的規(guī)則硬編碼,到如今依托海量數(shù)據(jù)和端到端大模型的“直覺化”駕駛,自動駕駛系統(tǒng)正在加速跨越從“機(jī)器”到“智能體”的界限。這種進(jìn)化的最終目標(biāo),是讓每一輛自動駕駛汽車都能像老司機(jī)一樣,在繁雜的路口做出最準(zhǔn)確的判斷。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關(guān)注

    關(guān)注

    792

    文章

    14808

    瀏覽量

    178450
  • 汽車
    +關(guān)注

    關(guān)注

    15

    文章

    4108

    瀏覽量

    40905
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動駕駛汽車如何識別紅綠燈?

    ,很多老司機(jī)憑借視覺和經(jīng)驗(yàn),可以快速判斷紅綠燈的情況。 這一簡單的場景對于自動駕駛汽車來說,卻有很多值得討論的地方。雖然只是根據(jù)燈的顏色決定行駛步驟,但紅綠燈識別無疑是自動駕駛系統(tǒng)最基
    的頭像 發(fā)表于 12-23 09:26 ?399次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>如何<b class='flag-5'>識別</b>紅綠燈?

    汽車自動駕駛的太陽光模擬應(yīng)用研究

    自動駕駛系統(tǒng)的安全性與可靠性,高度依賴于其在復(fù)雜多變光照環(huán)境中的穩(wěn)定表現(xiàn)。其中,高動態(tài)范圍的自然光照是挑戰(zhàn)車載感知系統(tǒng)的關(guān)鍵因素。紫創(chuàng)測控luminbox太陽光模擬器作為能夠精確復(fù)現(xiàn)光照輻射的室內(nèi)
    的頭像 發(fā)表于 12-10 18:04 ?241次閱讀
    <b class='flag-5'>汽車</b><b class='flag-5'>自動駕駛</b>的太陽光模擬應(yīng)用研究

    自動駕駛汽車如何確定自己的位置和所在車道?

    [首發(fā)于智駕最前沿微信公眾號]我們平時開車時,判斷自己在哪條路、哪個車道,只需要看一眼導(dǎo)航、掃幾眼車道線、再聽聽提示就夠了。但對自動駕駛汽車來說,這件事既簡單又復(fù)雜。簡單在于自動駕駛汽車
    的頭像 發(fā)表于 11-18 09:03 ?804次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>如何確定自己的位置和所在車道?

    不同等級的自動駕駛技術(shù)要求上有何不同?

    談到自動駕駛,不可避免地會涉及到自動駕駛分級,美國汽車工程師學(xué)會(SAE)根據(jù)自動駕駛系統(tǒng)與人類駕駛員參與
    的頭像 發(fā)表于 10-18 10:17 ?2635次閱讀

    XenG202G | 揮手手勢識別參考設(shè)計(三維)

    WEMAKERFSMART-賦予萬物感知的靈魂-矽典微ICLEGENDMICROXenG202G揮手手勢識別(三維)毫米波傳感器特征手勢識別
    的頭像 發(fā)表于 08-29 08:25 ?552次閱讀
    XenG202G | <b class='flag-5'>揮手</b><b class='flag-5'>手勢</b><b class='flag-5'>識別</b>參考設(shè)計(三維)

    如何確保自動駕駛汽車感知的準(zhǔn)確性?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛汽車想要自動駕駛,首先要做的就是能對周邊環(huán)境實(shí)現(xiàn)精準(zhǔn)感知,也就是能“看”清道路,那自動駕駛汽車如何在復(fù)
    的頭像 發(fā)表于 08-23 15:06 ?1581次閱讀
    如何確保<b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>感知的準(zhǔn)確性?

    自動駕駛汽車如何準(zhǔn)確識別小物體?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛汽車想要在道路上安全行駛,需要識別的東西遠(yuǎn)比我們所知道的諸如紅綠燈、行人、車輛等復(fù)雜得多。其中有一個是我們經(jīng)常會忽略,但同樣非常重要的障礙物,那就是小物體,像是
    的頭像 發(fā)表于 08-22 09:11 ?577次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>如何準(zhǔn)確<b class='flag-5'>識別</b>小物體?

    塑造自動駕駛汽車格局的核心技術(shù)

    自動駕駛汽車長期以來一直是科幻小說中的情節(jié),但在如今的2025年,它似乎已經(jīng)離我們越來越近,智能輔助駕駛已經(jīng)出現(xiàn)在越來越多的新能源汽車中。但距離完全的
    的頭像 發(fā)表于 08-21 16:03 ?859次閱讀

    自動駕駛汽車如何正確進(jìn)行道路識別?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛汽車在行駛過程中必須準(zhǔn)確識別道路環(huán)境,以便做出安全有效的決策,不同于人類開車,可以思考,自動駕駛汽車
    的頭像 發(fā)表于 06-29 09:40 ?1575次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>如何正確進(jìn)行道路<b class='flag-5'>識別</b>?

    自動駕駛汽車是如何準(zhǔn)確定位的?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的快速發(fā)展,車輛的精準(zhǔn)定位成為安全駕駛與路徑規(guī)劃的核心基礎(chǔ)。相比于傳統(tǒng)人類駕駛依賴路標(biāo)和視覺判斷,自動駕駛
    的頭像 發(fā)表于 06-28 11:42 ?1133次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>是如何準(zhǔn)確定位的?

    自動駕駛安全基石:ODD

    電子發(fā)燒友網(wǎng)綜合報道 自動駕駛ODD(Operational Design Domain)即設(shè)計運(yùn)行域,是指自動駕駛系統(tǒng)被設(shè)計為安全、有效運(yùn)行的具體條件范圍。它定義了自動駕駛汽車在哪些
    的頭像 發(fā)表于 05-19 03:52 ?6042次閱讀

    汽車駕駛自動化分級》會更適合中國自動駕駛發(fā)展嗎?

    [首發(fā)于智駕最前沿微信公眾號]智能化和網(wǎng)聯(lián)化技術(shù)的不斷突破,全球各國紛紛布局汽車駕駛自動化,而統(tǒng)一的分級標(biāo)準(zhǔn)不僅能夠為產(chǎn)業(yè)各方提供一致的技術(shù)評估和溝通基礎(chǔ),也為監(jiān)管部門在不同階段實(shí)施安全監(jiān)測與認(rèn)證
    的頭像 發(fā)表于 05-18 09:06 ?887次閱讀
    《<b class='flag-5'>汽車駕駛</b><b class='flag-5'>自動</b>化分級》會更適合中國<b class='flag-5'>自動駕駛</b>發(fā)展嗎?

    NVIDIA Halos自動駕駛汽車安全系統(tǒng)發(fā)布

    自動駕駛汽車的開發(fā)。正確的技術(shù)與框架對確保自動駕駛汽車駕駛員、乘客和行人的安全至關(guān)重要。 因此,NVIDIA 推出了NVIDIA Halos綜合安全系統(tǒng),將 NVIDIA 的
    的頭像 發(fā)表于 03-25 14:51 ?1102次閱讀

    理想汽車推出全新自動駕駛架構(gòu)

    2025年3月18日,理想汽車自動駕駛技術(shù)研發(fā)負(fù)責(zé)人賈鵬在NVIDIA GTC 2025發(fā)表主題演講《VLA:邁向自動駕駛物理智能體的關(guān)鍵一步》,分享了理想汽車對于下一代
    的頭像 發(fā)表于 03-19 14:12 ?1006次閱讀