chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

端到端在自動駕駛中起到什么作用?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-10-22 09:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的發(fā)展,端到端憑借其獨特優(yōu)勢,被越來越多企業(yè)所推崇。所謂端到端,就是把從傳感器(比如攝像頭、雷達(dá))到車輛動作(轉(zhuǎn)向、油門、剎車)這條鏈條交給學(xué)習(xí)模型去“整體”學(xué)會,而不是把問題拆成一大堆由人寫規(guī)則的子模塊。端到端分為狹義端到端與廣義端到端,狹義端到端指通過單一神經(jīng)網(wǎng)絡(luò)將原始信號直接映射為控制指令;廣義端到端則更強調(diào)信息在流程中盡可能保持原始形態(tài)、減少人為壓縮,并通過數(shù)據(jù)驅(qū)動實現(xiàn)整體目標(biāo),即使中間仍存在部分工程接口。

wKgZO2j4Lg-AQdLXAABmTCvByXA200.jpg

狹義端到端自動駕駛架構(gòu)(單一神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)感知、決策規(guī)劃、控制)

wKgZPGj4Lg-AWTTgAABa1M9oKDI933.jpg

廣義端到端自動駕駛架構(gòu)(神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)感知與決策規(guī)劃,不包括控制模塊)

wKgZO2j4LhCACkXHAABHVCDPtdU656.jpg

廣義端到端自動駕駛架構(gòu)(感知和決策規(guī)劃使用神經(jīng)網(wǎng)絡(luò),模塊之間仍有人工設(shè)計的數(shù)據(jù)接口)

用更直白的話來理解,傳統(tǒng)自動駕駛像把一輛車拆成感知、定位、預(yù)測、規(guī)劃、控制幾個模塊,每個模塊單獨優(yōu)化再接在一起;端到端的想法是,讓一張大網(wǎng)學(xué)會從輸入到輸出的整體映射,用數(shù)據(jù)告訴它“這樣做就是好”的標(biāo)準(zhǔn),而不是每一步都由工程師給出規(guī)則,然后根據(jù)規(guī)則去完成操作。

wKgZPGj4LhCACWhiAAAQo00DEvw292.jpg

感知那塊到底發(fā)生了什么變化?

在早期的自動駕駛系統(tǒng)中,感知任務(wù)主要集中于二維或三維檢測,其目標(biāo)是識別圖像中的物體(如車輛、行人、車道線),并將這些帶有標(biāo)簽的邊界框提供給下游模塊。然而,這種以“框”為核心的數(shù)據(jù)形式,與后續(xù)的路徑規(guī)劃模塊之間存在語義隔閡。

近年來,一種主流趨勢是將多攝像頭、多傳感器的數(shù)據(jù)統(tǒng)一投影到一個共同的“鳥瞰圖”(BEV)空間中。BEV通過將不同視角的信息融合進一個統(tǒng)一的、具備空間一致性的坐標(biāo)系,極大地便利了路徑規(guī)劃與動態(tài)信息的融合。因此,BEV的普及實質(zhì)上重塑了感知與規(guī)劃之間的接口,使其更易于被端到端的學(xué)習(xí)模型所理解與利用。

但BEV仍是二維的,缺乏高度信息。于是有方案提出把表示能力往三維擴展,引入“占用網(wǎng)絡(luò)”(Occupancy,簡稱OCC)這樣的稠密時空場表示。占用網(wǎng)絡(luò)不是簡單地提供“這里有個車”這樣的數(shù)據(jù),而是把“某個空間點在未來若干幀里被什么占著、有多大概率被占著”等數(shù)據(jù)給厘清出,它把時間維、空間維和不確定性都納進來,對動態(tài)交互的建模更友好。

現(xiàn)階段,“世界模型”的概念越來越火熱,其核心思想是構(gòu)建一個能夠重建并推演世界動態(tài)的模型,讓系統(tǒng)不僅能“看到現(xiàn)在”,還能“想象未來會發(fā)生什么”。世界模型既能用于生成訓(xùn)練數(shù)據(jù)(彌補真實長尾樣本短缺),也能在決策時作為內(nèi)部仿真器來評估不同動作的后果。世界模型不僅是感知/認(rèn)知能力升級的工具,也是端到端訓(xùn)練和驗證的重要補充,但也要注意,如果世界模型生成的數(shù)據(jù)與真實世界分布差別太大,也會誤導(dǎo)訓(xùn)練。

wKgZPGj4LhGAZC0tAABXYATu5mM151.jpg

端到端自動駕駛架構(gòu)演進示意圖

wKgZO2j4LhGAIzIeAAAR42n7O-I055.jpg

決策層怎么學(xué)?

完成環(huán)境感知后,如何將決策規(guī)劃交由學(xué)習(xí)模型,主要有幾種路徑,其一是模仿學(xué)習(xí),通過擬合人類駕駛數(shù)據(jù)來快速獲得基礎(chǔ)能力,但泛化性不足,在偏離示范數(shù)據(jù)時表現(xiàn)不佳;其二是強化學(xué)習(xí),通過試錯學(xué)得魯棒策略,但依賴仿真環(huán)境以規(guī)避現(xiàn)實風(fēng)險;結(jié)合二者優(yōu)勢的路徑也頗為常見,先用模仿學(xué)習(xí)初始化模型,再通過強化學(xué)習(xí)在仿真中優(yōu)化長期收益。報告將這些方法均視為實現(xiàn)端到端決策的候選方案。

世界模型在決策層扮演著關(guān)鍵角色,它能夠基于當(dāng)前狀態(tài),在模型內(nèi)部生成多種合理的未來場景,從而輔助決策模塊進行“前瞻性思考”。這意味著系統(tǒng)無需在現(xiàn)實世界中反復(fù)試錯,而是可以在其內(nèi)部模擬環(huán)境中評估不同動作的潛在后果,進而選擇更安全、更有效的策略。這一機制對于處理長尾和極端場景具有重要價值,但若生成場景與真實世界分布存在顯著偏差,也可能引入決策風(fēng)險,因此必須審慎使用生成數(shù)據(jù)。

此外,還有一種折中路徑,便是“模塊化端到端”。該方案在感知端使用神經(jīng)網(wǎng)絡(luò)輸出豐富的中間表征(如BEV特征或時空占用場),而在決策與控制層則保留或并行運行一個相對輕量且可解釋的模型。模塊之間通過特征向量進行交互,而非依賴人類可讀的標(biāo)簽。這種方式在工程實踐中更易于驗證與調(diào)試,因此被不少國內(nèi)廠商視為當(dāng)前階段向全端到端系統(tǒng)過渡的可行方案。

wKgZPGj4LhGAZ7qdAAASG3BOmsQ298.jpg

工程上必須面對的硬問題有哪些?

想將端到端自動駕駛從技術(shù)推導(dǎo)走向大規(guī)模量產(chǎn),必須跨越數(shù)據(jù)、算力、驗證、可解釋性與持續(xù)學(xué)習(xí)等一系列現(xiàn)實瓶頸。這些挑戰(zhàn)共同構(gòu)成了當(dāng)前技術(shù)落地的主要門檻,也決定了產(chǎn)業(yè)競爭的焦點與節(jié)奏。

端到端模型對數(shù)據(jù)的規(guī)模、質(zhì)量及長尾場景覆蓋度均有極高要求。與語言模型可依賴海量公開文本不同,自動駕駛需依賴大量真實行車視頻、車輛狀態(tài)及對應(yīng)的人類駕駛行為數(shù)據(jù),且必須覆蓋夜間、雨雪、施工區(qū)、臨時障礙物等稀有場景。特斯拉目前在數(shù)據(jù)規(guī)模上就具備領(lǐng)先優(yōu)勢,其通過影子模式、自動標(biāo)注與回放訓(xùn)練構(gòu)建了高效的數(shù)據(jù)閉環(huán)系統(tǒng)。

端到端訓(xùn)練還遵循“規(guī)模法則”,更大的模型、更多的數(shù)據(jù)與更長的訓(xùn)練時間通常帶來性能提升,這推動了對大規(guī)模云端GPU集群的投入。車端與云端算力作為自動駕駛行業(yè)關(guān)鍵競爭要素,車端需滿足低延遲與高可靠性,而云端則承擔(dān)大規(guī)模訓(xùn)練任務(wù),目前多數(shù)團隊需依賴千卡級別的訓(xùn)練資源。

驗證是端到端需要面對的另一大難題。端到端系統(tǒng)難以僅通過傳統(tǒng)離線指標(biāo)評估真實表現(xiàn)。開環(huán)(離線)評估通過對比模型輸出與人類軌跡,雖簡便但缺乏交互性檢驗;閉環(huán)(在線)仿真可測試系統(tǒng)的交互與恢復(fù)能力,但構(gòu)建高保真、覆蓋長尾場景的仿真環(huán)境本身即為挑戰(zhàn)??赏ㄟ^構(gòu)建融合離線評估、閉環(huán)仿真與真實世界影子測試/漸進推送的驗證體系,世界模型雖可部分填補長尾數(shù)據(jù)空白,但其生成偏差帶來的驗證風(fēng)險不容忽視。

wKgZO2j4LhKAMl7SAACfcjujsdw951.jpg

在線/閉環(huán)測試與離線/開環(huán)測試的主要特點與優(yōu)缺點

可解釋性與災(zāi)難性遺忘是端到端不可不避免的兩個問題。端到端模型天然具有“黑盒”屬性,工程落地與監(jiān)管合規(guī)均要求理解“模型為何做出特定決策”,尤其在事故或異常情況下需具備追溯能力。對于這個問題可以應(yīng)對的策略包括并聯(lián)視覺語言模型(將中間表征轉(zhuǎn)化為可讀描述)、模塊化檢查點設(shè)計,以及在訓(xùn)練中引入規(guī)則約束等。在災(zāi)難性遺忘方面,當(dāng)模型使用新數(shù)據(jù)微調(diào)以改進特定復(fù)雜場景時,可能削弱原有能力,實踐中已出現(xiàn)版本回退案例。對此的緩解手段包括舊樣本回放、權(quán)重固化等技術(shù)。

wKgZPGj4LhKAKCUlAAASAJELks8481.jpg

技術(shù)方向上的差異

在技術(shù)路徑選擇上,行業(yè)呈現(xiàn)出不同的演進策略。特斯拉堅持純視覺方案,基于BEV+Transformer+占用網(wǎng)絡(luò)構(gòu)建單一端到端模型,依托海量影子模式數(shù)據(jù)和回放訓(xùn)練機制實現(xiàn)快速迭代。而國內(nèi)主流廠商如華為、小鵬、理想等則普遍采用“模塊化端到端”或“雙系統(tǒng)”架構(gòu),在追求性能上限的同時,保留系統(tǒng)的可解釋性與應(yīng)急處理能力。

需要明確的是,技術(shù)落地不僅需要前沿的理念,更依賴扎實的工程化基礎(chǔ)。其中,數(shù)據(jù)閉環(huán)的效率、算力部署的規(guī)模與驗證體系的完備性,共同構(gòu)成了端到端系統(tǒng)能否穩(wěn)定落地并持續(xù)演進的關(guān)鍵支撐。正因如此,“數(shù)據(jù)+算力”才是端到端競爭的核心要素,這也是為何具備資源優(yōu)勢的頭部企業(yè),在端到端落地的進程中能夠保持明顯的先發(fā)優(yōu)勢。

wKgZO2j4LhOAa16QAAARwcz1hbg319.jpg

最后的話

端到端自動駕駛的實現(xiàn)依賴于完整的技術(shù)鏈條,感知層面從傳統(tǒng)檢測向BEV和時空占用網(wǎng)絡(luò)演進,為決策提供更豐富的環(huán)境表征;決策層面結(jié)合模仿學(xué)習(xí)、強化學(xué)習(xí)和世界模型推演,使系統(tǒng)具備預(yù)測與規(guī)劃能力;工程落地則依靠數(shù)據(jù)閉環(huán)、算力集群和多重驗證體系作為支撐,同時必須解決模型可解釋性與災(zāi)難性遺忘等現(xiàn)實挑戰(zhàn)。當(dāng)前技術(shù)發(fā)展仍受數(shù)據(jù)質(zhì)量與算力規(guī)模的關(guān)鍵制約,這也決定了端到端系統(tǒng)從概念驗證到量產(chǎn)落地的實際進程。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 端到端
    +關(guān)注

    關(guān)注

    0

    文章

    40

    瀏覽量

    10767
  • 自動駕駛
    +關(guān)注

    關(guān)注

    791

    文章

    14552

    瀏覽量

    174318
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    西井科技自動駕駛模型獲得國際認(rèn)可

    近日,西井科技AI創(chuàng)研團隊國際權(quán)威自動駕駛算法榜單NAVSIM v2脫穎而出,憑借創(chuàng)新的
    的頭像 發(fā)表于 10-15 17:20 ?862次閱讀

    一文讀懂特斯拉自動駕駛FSD從輔助的演進

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛行業(yè)發(fā)展至今,特斯拉一直被很多企業(yè)對標(biāo),其FSD系統(tǒng)的每一次更新,都會獲得非常多人的關(guān)注。早期自動駕駛是一個分層的、由多模塊組成的系統(tǒng),感知、定位、預(yù)測、規(guī)劃
    的頭像 發(fā)表于 10-11 09:13 ?174次閱讀
    一文讀懂特斯拉<b class='flag-5'>自動駕駛</b>FSD從輔助<b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的演進

    自動駕駛大模型為什么會有不確定性?

    。為了能讓自動駕駛汽車做出正確、安全且符合邏輯的行駛動作,大模型被提了出來。
    的頭像 發(fā)表于 09-28 09:20 ?397次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型為什么會有不確定性?

    自動駕駛相較傳統(tǒng)自動駕駛到底有何提升?

    各自專業(yè)模塊獨立承擔(dān),再通過預(yù)定的接口協(xié)議將信息有序傳遞。與之相對照,“”(end-to-end)自動駕駛以統(tǒng)一的大規(guī)模神經(jīng)網(wǎng)絡(luò)為核心,將從攝像頭、雷達(dá)、激光雷達(dá)等傳感器采集
    的頭像 發(fā)表于 09-02 09:09 ?397次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動駕駛</b>相較傳統(tǒng)<b class='flag-5'>自動駕駛</b>到底有何提升?

    Nullmax自動駕駛最新研究成果入選ICCV 2025

    近日,國際計算機視覺大會 ICCV 2025 正式公布論文錄用結(jié)果,Nullmax 感知團隊自動駕駛方向的最新研究成果《HiP-AD
    的頭像 發(fā)表于 07-05 15:40 ?1414次閱讀
    Nullmax<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動駕駛</b>最新研究成果入選ICCV 2025

    為什么自動駕駛大模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)落地,(End-to-End)大模型也成為行業(yè)研究與應(yīng)用的熱門方向。相較于傳統(tǒng)自動駕駛
    的頭像 發(fā)表于 07-04 16:50 ?462次閱讀
    為什么<b class='flag-5'>自動駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有黑盒特性?

    數(shù)據(jù)標(biāo)注方案自動駕駛領(lǐng)域的應(yīng)用優(yōu)勢

    10-20TB,其中需要標(biāo)注的數(shù)據(jù)占比超過60%。在這樣的背景下,數(shù)據(jù)標(biāo)注方案應(yīng)運而生,正在重塑自動駕駛的數(shù)據(jù)生產(chǎn)范式。
    的頭像 發(fā)表于 06-23 17:27 ?637次閱讀

    一文帶你厘清自動駕駛架構(gòu)差異

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)飛速發(fā)展,智能駕駛系統(tǒng)的設(shè)計思路也經(jīng)歷了從傳統(tǒng)模塊化架構(gòu)
    的頭像 發(fā)表于 05-08 09:07 ?639次閱讀
    一文帶你厘清<b class='flag-5'>自動駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>架構(gòu)差異

    自動駕駛基于規(guī)則的決策和大模型有何區(qū)別?

    自動駕駛架構(gòu)的選擇上,也經(jīng)歷了從感知、決策控制、執(zhí)行的三段式架構(gòu)到現(xiàn)在火熱的大模型,尤其是
    的頭像 發(fā)表于 04-13 09:38 ?3278次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中</b>基于規(guī)則的決策和<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有何區(qū)別?

    東風(fēng)汽車推出自動駕駛開源數(shù)據(jù)集

    近日,智能網(wǎng)聯(lián)汽車智駕數(shù)據(jù)空間構(gòu)建研討會暨汽協(xié)會智能網(wǎng)聯(lián)汽車分會、數(shù)據(jù)分會2024年度會議在上海舉辦。會上,東風(fēng)汽車發(fā)布行業(yè)規(guī)模最大、涵蓋125萬組高質(zhì)量數(shù)據(jù)的
    的頭像 發(fā)表于 04-01 14:54 ?841次閱讀

    DiffusionDrive首次自動駕駛引入擴散模型

    ? ? 近年來,自動駕駛成為研究熱點,其核心在于從傳感器數(shù)據(jù)直接學(xué)習(xí)駕駛決策。然而,駕駛
    的頭像 發(fā)表于 03-08 13:59 ?1320次閱讀
    DiffusionDrive首次<b class='flag-5'>在</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動駕駛</b><b class='flag-5'>中</b>引入擴散模型

    自動駕駛技術(shù)研究與分析

    編者語:「智駕最前沿」微信公眾號后臺回復(fù):C-0450,獲取本文參考報告:《自動駕駛行業(yè)研究報告》pdf下載方式。 自動駕駛進入202
    的頭像 發(fā)表于 12-19 13:07 ?1233次閱讀

    自動泊車的應(yīng)用

    與城市環(huán)境的復(fù)雜性和高速公路駕駛的風(fēng)險相比,停車場景的特點是低速、空間有限和高可控性。這些特點為在車輛逐步部署
    的頭像 發(fā)表于 12-18 11:38 ?1356次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>在</b><b class='flag-5'>自動</b>泊車的應(yīng)用

    連接視覺語言大模型與自動駕駛

    自動駕駛大規(guī)模駕駛數(shù)據(jù)上訓(xùn)練,展現(xiàn)出很強的決策規(guī)劃能力,但是面對復(fù)雜罕見的
    的頭像 發(fā)表于 11-07 15:15 ?967次閱讀
    連接視覺語言大模型與<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動駕駛</b>

    Waymo利用谷歌Gemini大模型,研發(fā)端自動駕駛系統(tǒng)

    10月31日訊,自動駕駛領(lǐng)域的先鋒Waymo,作為Alphabet旗下的一員,長久以來將其與谷歌DeepMind的緊密合作及深厚的AI研究底蘊視為其自動駕駛競賽脫穎而出的關(guān)鍵。如今
    的頭像 發(fā)表于 10-31 16:55 ?2168次閱讀