chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Transformer在端到端自動(dòng)駕駛架構(gòu)中是何定位?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-08-03 11:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛系統(tǒng)從模塊化走向端到端,Transformer正逐漸被引入到端到端架構(gòu)中,試圖解決傳統(tǒng)模型在復(fù)雜語義理解、全局路徑推理以及行為預(yù)測上的局限。但我們必須清晰認(rèn)識(shí)到,Transformer在端到端架構(gòu)中的作用既非全能主腦,也并非簡單插件,它更像是“認(rèn)知大腦”的角色,在端到端系統(tǒng)中承擔(dān)高階決策與抽象建模的任務(wù),而具體的感知、控制、接口層仍需要傳統(tǒng)深度學(xué)習(xí)模型支撐。這種多層次分工,是現(xiàn)階段端到端架構(gòu)得以落地的現(xiàn)實(shí)路徑。

傳統(tǒng)端到端架構(gòu)追求的是感知、決策、控制“一體化”建模,即通過一個(gè)大模型輸入傳感器原始數(shù)據(jù)(如圖像、點(diǎn)云、雷達(dá)),直接輸出轉(zhuǎn)向角、加速度、剎車指令等操作值。在這個(gè)過程中,模型在內(nèi)部完成了目標(biāo)識(shí)別、語義理解、路徑預(yù)測等任務(wù),但由于中間過程不可分割,因此也失去了可解釋性與調(diào)試能力。這在學(xué)術(shù)實(shí)驗(yàn)中尚可接受,但在需要極高安全保障的商用場景中存在巨大風(fēng)險(xiǎn)。Transformer試圖通過其在序列建模和上下文理解上的強(qiáng)大能力,提升端到端模型的抽象表達(dá)能力,并通過“注意力機(jī)制”模擬決策過程的透明性。

目前,典型的Transformer架構(gòu)已被用于構(gòu)建“感知-規(guī)劃-控制統(tǒng)一建?!钡姆桨?。如Waymo和小馬智行正在研發(fā)的多模態(tài)大模型(MultimodalLargeModels,MLLMs),將來自攝像頭、激光雷達(dá)、毫米波雷達(dá)的數(shù)據(jù)融合輸入,并結(jié)合地圖語義、交通規(guī)則、歷史軌跡等信息,交由Transformer構(gòu)建多層次時(shí)空表征。這種表征并非直接輸出控制命令,而是形成一個(gè)“世界模型”——即系統(tǒng)對(duì)當(dāng)前交通狀態(tài)的主觀理解。隨后,該模型再將理解結(jié)果交由行為規(guī)劃子模塊去執(zhí)行,使得端到端過程具有一定結(jié)構(gòu)化邏輯,從而兼顧可解釋性與泛化能力。

Transformer在此過程中承擔(dān)了以下幾個(gè)關(guān)鍵角色,首先,它作為感知與推理的中間橋梁,將多模態(tài)信息統(tǒng)一編碼后,建立不同要素之間的因果關(guān)系。如前方車輛正在減速、右側(cè)有行人接近斑馬線、紅綠燈為黃色,這一系列事件并非孤立,而是需要模型結(jié)合上下文統(tǒng)一判斷其潛在交互模式。傳統(tǒng)深度學(xué)習(xí)模型常以圖像特征為主導(dǎo),缺乏事件間的時(shí)間序列建模能力,而Transformer則可通過自注意力機(jī)制理解其潛在邏輯與權(quán)重。

其次,在行為預(yù)測與交互建模方面,Transformer的優(yōu)勢更加明顯。當(dāng)前大多數(shù)自動(dòng)駕駛車輛仍面臨“交互不清晰”的問題,即無法準(zhǔn)確預(yù)測其他交通參與者的未來行為。在密集城市交通中,行人與非機(jī)動(dòng)車的行為極具不確定性,傳統(tǒng)模塊化方法常常分工割裂,難以統(tǒng)一評(píng)估這些交互背后的潛在意圖。而Transformer可將多方信息整合為統(tǒng)一的時(shí)序表示,并通過預(yù)訓(xùn)練或遷移學(xué)習(xí),推斷出最合理的策略響應(yīng)。這種“策略編排能力”正是大模型在端到端架構(gòu)中所具備的關(guān)鍵競爭力。

但我們也必須看到,Transformer模型在端到端架構(gòu)中的部署仍有很多問題需要解決。首先是實(shí)時(shí)性。自動(dòng)駕駛決策周期通??刂圃?0~100毫秒以內(nèi),而當(dāng)前參數(shù)級(jí)別在數(shù)十億的LLM模型,其推理時(shí)間遠(yuǎn)超這一窗口,哪怕在專用加速芯片上也難以滿足高頻循環(huán)執(zhí)行的需要。為此,有方案正在嘗試構(gòu)建“輕量化Transformer”或剪枝后的中型模型,用于車端執(zhí)行,同時(shí)將大型模型部署在云端,用于訓(xùn)練、場景生成和后處理分析。

其次是數(shù)據(jù)來源與分布一致性問題。端到端架構(gòu)中,訓(xùn)練數(shù)據(jù)的分布對(duì)最終模型穩(wěn)定性至關(guān)重要。Transformer需要大規(guī)模多樣化的訓(xùn)練語料,但當(dāng)前自動(dòng)駕駛行業(yè)的數(shù)據(jù)集大多來自“長尾場景稀缺”的真實(shí)道路采集,難以支持Transformer在各種極端場景中的泛化學(xué)習(xí)。因此,越來越多采用仿真平臺(tái)生成“近物理級(jí)真實(shí)場景”,通過虛擬交通參與者的動(dòng)態(tài)交互來拓展模型的訓(xùn)練維度。英偉達(dá)的Omniverse與小馬智行的Cosmos就是典型代表,它們利用物理引擎+世界建模的方式,賦能Transformer實(shí)現(xiàn)更完整的場景理解與遷移學(xué)習(xí)。

可解釋性問題仍是另一個(gè)待解命題。盡管Transformer的注意力權(quán)重圖可以部分展示模型的“關(guān)注焦點(diǎn)”,但其內(nèi)部推理路徑、權(quán)重更新機(jī)制依舊缺乏明確可控的數(shù)學(xué)表達(dá)式。這意味著當(dāng)模型在特定場景下做出錯(cuò)誤決策時(shí),我們難以準(zhǔn)確還原其出錯(cuò)節(jié)點(diǎn)。這對(duì)負(fù)責(zé)安全評(píng)估的工程師或監(jiān)管機(jī)構(gòu)來說是巨大障礙。因此,現(xiàn)階段很多自動(dòng)駕駛方案并不完全放棄中間模塊,而是采取“端到端+模塊化結(jié)合”的策略,既保留可追溯路徑,也提升建模能力。

在實(shí)際部署時(shí),Transformer常被用于“策略融合層”或“全局語義層”。在系統(tǒng)完成環(huán)境感知之后,Transformer可用來處理如“當(dāng)前進(jìn)入學(xué)校區(qū)域需減速”、“根據(jù)紅綠燈邏輯調(diào)整等待時(shí)間”等上下文規(guī)則。這種基于語義的規(guī)則推理與路徑重組,正是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)難以處理的抽象邏輯任務(wù),也是Transformer最為擅長的部分。從長遠(yuǎn)來看,這種認(rèn)知能力的引入或?qū)⑼苿?dòng)自動(dòng)駕駛從“感知驅(qū)動(dòng)”向“意圖驅(qū)動(dòng)”轉(zhuǎn)型,讓車輛不僅看到周圍發(fā)生了什么,還能理解“為什么”會(huì)發(fā)生,從而更好地預(yù)測“接下來會(huì)發(fā)生什么”。

還有一些技術(shù)方案正在探索更為極致的端到端方式,如將Transformer作為唯一的大模型,從傳感器輸入到控制輸出全部涵蓋。特斯拉的FSD Beta系統(tǒng)便試圖走這條路徑,嘗試用Transformer編排整個(gè)感知-決策流程,規(guī)避中間人工規(guī)則的干預(yù)。然而,目前該方案仍面臨大量質(zhì)疑。其在面對(duì)突發(fā)情況時(shí)缺乏故障冗余;系統(tǒng)行為的不可解釋性也令監(jiān)管機(jī)構(gòu)難以接受。因此,哪怕在特斯拉公布的Robotaxi項(xiàng)目中,仍需配備人工監(jiān)控機(jī)制以確保安全兜底。這充分說明,在安全為前提的自動(dòng)駕駛場景中,Transformer在端到端中的應(yīng)用尚處于“受限”階段。

綜上,Transformer在端到端自動(dòng)駕駛架構(gòu)中的角色定位,絕不是“替代一切”的通用工具,也不是某些理想主義者期待的“萬能大腦”。更準(zhǔn)確地說,它是一種用于抽象建模、高階推理、語義決策與交互理解的智能補(bǔ)丁。它填補(bǔ)了傳統(tǒng)深度學(xué)習(xí)難以處理的認(rèn)知空白,為系統(tǒng)帶來了更強(qiáng)的泛化能力與策略靈活性。它并不取代感知、控制等需要硬實(shí)時(shí)與高穩(wěn)定性的基礎(chǔ)模塊,而是通過融合架構(gòu)提升整個(gè)系統(tǒng)的智能密度。在未來的系統(tǒng)演進(jìn)中,Transformer將可能更多地參與“認(rèn)知層”設(shè)計(jì),成為輔助駕駛系統(tǒng)的“推理引擎”,但真正掌握方向盤的,仍然是深度學(xué)習(xí)與工程控制的“執(zhí)行大腦”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    791

    文章

    14542

    瀏覽量

    173853
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    153

    瀏覽量

    6718
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    西井科技自動(dòng)駕駛模型獲得國際認(rèn)可

    近日,西井科技AI創(chuàng)研團(tuán)隊(duì)國際權(quán)威自動(dòng)駕駛算法榜單NAVSIM v2脫穎而出,憑借創(chuàng)新的
    的頭像 發(fā)表于 10-15 17:20 ?802次閱讀

    一文讀懂特斯拉自動(dòng)駕駛FSD從輔助的演進(jìn)

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛行業(yè)發(fā)展至今,特斯拉一直被很多企業(yè)對(duì)標(biāo),其FSD系統(tǒng)的每一次更新,都會(huì)獲得非常多人的關(guān)注。早期自動(dòng)駕駛是一個(gè)分層的、由多模塊組成的系統(tǒng),感知、定位、預(yù)測、規(guī)劃
    的頭像 發(fā)表于 10-11 09:13 ?142次閱讀
    一文讀懂特斯拉<b class='flag-5'>自動(dòng)駕駛</b>FSD從輔助<b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的演進(jìn)

    自動(dòng)駕駛大模型為什么會(huì)有不確定性?

    。為了能讓自動(dòng)駕駛汽車做出正確、安全且符合邏輯的行駛動(dòng)作,大模型被提了出來。
    的頭像 發(fā)表于 09-28 09:20 ?372次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型為什么會(huì)有不確定性?

    自動(dòng)駕駛相較傳統(tǒng)自動(dòng)駕駛到底有提升?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)自誕生以來,便承載了人類對(duì)安全、高效、智能出行的美好憧憬。傳統(tǒng)自動(dòng)駕駛系統(tǒng)以層次化、模塊化的架構(gòu)為主,將感知、定位、規(guī)劃與決策、控制四大核心功
    的頭像 發(fā)表于 09-02 09:09 ?361次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>相較傳統(tǒng)<b class='flag-5'>自動(dòng)駕駛</b>到底有<b class='flag-5'>何</b>提升?

    一段式自動(dòng)駕駛到底有優(yōu)勢?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)的發(fā)展歷程,模塊化架構(gòu)曾長期占據(jù)主導(dǎo)地位,從多傳感器數(shù)據(jù)采集,特征提取與目標(biāo)檢測,再到路徑規(guī)
    的頭像 發(fā)表于 08-05 09:06 ?539次閱讀
    一段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>在</b><b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中</b>到底有<b class='flag-5'>何</b>優(yōu)勢?

    Nullmax自動(dòng)駕駛最新研究成果入選ICCV 2025

    近日,國際計(jì)算機(jī)視覺大會(huì) ICCV 2025 正式公布論文錄用結(jié)果,Nullmax 感知團(tuán)隊(duì)自動(dòng)駕駛方向的最新研究成果《HiP-AD
    的頭像 發(fā)表于 07-05 15:40 ?1387次閱讀
    Nullmax<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>最新研究成果入選ICCV 2025

    為什么自動(dòng)駕駛大模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)落地,(End-to-End)大模型也成為行業(yè)研究與應(yīng)用的熱門方向。相較于傳統(tǒng)自動(dòng)駕駛
    的頭像 發(fā)表于 07-04 16:50 ?440次閱讀
    為什么<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有黑盒特性?

    數(shù)據(jù)標(biāo)注方案自動(dòng)駕駛領(lǐng)域的應(yīng)用優(yōu)勢

    10-20TB,其中需要標(biāo)注的數(shù)據(jù)占比超過60%。在這樣的背景下,數(shù)據(jù)標(biāo)注方案應(yīng)運(yùn)而生,正在重塑自動(dòng)駕駛的數(shù)據(jù)生產(chǎn)范式。
    的頭像 發(fā)表于 06-23 17:27 ?621次閱讀

    一文帶你厘清自動(dòng)駕駛架構(gòu)差異

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)飛速發(fā)展,智能駕駛系統(tǒng)的設(shè)計(jì)思路也經(jīng)歷了從傳統(tǒng)模塊化架構(gòu)
    的頭像 發(fā)表于 05-08 09:07 ?622次閱讀
    一文帶你厘清<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>架構(gòu)</b>差異

    自動(dòng)駕駛基于規(guī)則的決策和大模型有區(qū)別?

    自動(dòng)駕駛架構(gòu)的選擇上,也經(jīng)歷了從感知、決策控制、執(zhí)行的三段式架構(gòu)到現(xiàn)在火熱的
    的頭像 發(fā)表于 04-13 09:38 ?3257次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中</b>基于規(guī)則的決策和<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有<b class='flag-5'>何</b>區(qū)別?

    DiffusionDrive首次自動(dòng)駕駛引入擴(kuò)散模型

    ? ? 近年來,自動(dòng)駕駛成為研究熱點(diǎn),其核心在于從傳感器數(shù)據(jù)直接學(xué)習(xí)駕駛決策。然而,駕駛
    的頭像 發(fā)表于 03-08 13:59 ?1290次閱讀
    DiffusionDrive首次<b class='flag-5'>在</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中</b>引入擴(kuò)散模型

    自動(dòng)駕駛技術(shù)研究與分析

    傳遞和全局優(yōu)化的優(yōu)勢,成為智能駕駛技術(shù)發(fā)展的重要方向。與傳統(tǒng)模塊化架構(gòu)相比,技術(shù)通過深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)從傳感器數(shù)據(jù)輸入
    的頭像 發(fā)表于 12-19 13:07 ?1198次閱讀

    自動(dòng)泊車的應(yīng)用

    與城市環(huán)境的復(fù)雜性和高速公路駕駛的風(fēng)險(xiǎn)相比,停車場景的特點(diǎn)是低速、空間有限和高可控性。這些特點(diǎn)為在車輛逐步部署
    的頭像 發(fā)表于 12-18 11:38 ?1335次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>在</b><b class='flag-5'>自動(dòng)</b>泊車的應(yīng)用

    連接視覺語言大模型與自動(dòng)駕駛

    自動(dòng)駕駛大規(guī)模駕駛數(shù)據(jù)上訓(xùn)練,展現(xiàn)出很強(qiáng)的決策規(guī)劃能力,但是面對(duì)復(fù)雜罕見的
    的頭像 發(fā)表于 11-07 15:15 ?955次閱讀
    連接視覺語言大模型與<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>

    Mobileye自動(dòng)駕駛解決方案的深度解析

    強(qiáng)大的技術(shù)優(yōu)勢。 Mobileye的解決方案概述 1.1 什么是
    的頭像 發(fā)表于 10-17 09:35 ?1086次閱讀
    Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>解決方案的深度解析