chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

佐思汽研發(fā)布《2024年端到端自動(dòng)駕駛研究報(bào)告》

佐思汽車研究 ? 來源:佐思汽車研究 ? 2024-04-20 11:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

佐思汽研發(fā)布《2024年端到端自動(dòng)駕駛研究報(bào)告》。

1

國(guó)內(nèi)端到端方案現(xiàn)狀

端到端自動(dòng)駕駛是直接從傳感器信息輸入(如攝像頭圖像、LiDAR等)到控制命令輸出(如轉(zhuǎn)向、加減速等)映射的一套系統(tǒng),最早出現(xiàn)在1988年的ALVINN項(xiàng)目,通過相機(jī)和激光測(cè)距儀進(jìn)行輸入和一個(gè)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)生成的轉(zhuǎn)向進(jìn)行輸出。

2024年初,特斯拉FSD V12.3版本發(fā)布,智駕水平讓人驚艷,端到端自動(dòng)駕駛方案受到國(guó)內(nèi)主機(jī)廠和自動(dòng)駕駛方案企業(yè)的廣泛關(guān)注。

與傳統(tǒng)的多模塊方案相比,端到端自動(dòng)駕駛方案將感知、預(yù)測(cè)和規(guī)劃整合到單一模型中,簡(jiǎn)化了方案結(jié)構(gòu),可模擬人類駕駛員直接從視覺輸入做出駕駛決策,以數(shù)據(jù)和算力為主導(dǎo),能夠有效解決模塊化方案的長(zhǎng)尾場(chǎng)景,提升模型的訓(xùn)練效率和性能上限。

傳統(tǒng)多模塊方案與端到端方案的對(duì)比(部分)

5f27f580-fec3-11ee-a297-92fbcf53809c.png

來源:佐思汽研《2024年端到端自動(dòng)駕駛研究報(bào)告》

FSD V12.3版本實(shí)測(cè)圖

5f4f3b68-fec3-11ee-a297-92fbcf53809c.png

來源:公開渠道

部分主機(jī)廠對(duì)端到端方案落地量產(chǎn)的規(guī)劃

608716a4-fec3-11ee-a297-92fbcf53809c.png

來源:佐思汽研《2024年端到端自動(dòng)駕駛研究報(bào)告》

理想端到端方案

理想認(rèn)為,完整的端到端需要完成感知、跟蹤、預(yù)測(cè)、決策、規(guī)劃整個(gè)過程的模型化,是實(shí)現(xiàn)L3級(jí)別自動(dòng)駕駛的最佳方案。2023年,理想推送AD Max3.0,其整體框架已經(jīng)具備端到端的理念,但距離完整的端到端尚有一定差距,2024年理想預(yù)計(jì)以此為基礎(chǔ),推進(jìn)該系統(tǒng)成為一個(gè)徹底的端到端方案。

理想構(gòu)建的自動(dòng)駕駛框架如下圖,分為兩個(gè)系統(tǒng):

快系統(tǒng):System1,感知周圍環(huán)境后直接執(zhí)行,為理想現(xiàn)行的端到端方案。

慢系統(tǒng):System2,多模態(tài)大語言模型,針對(duì)未知環(huán)境進(jìn)行邏輯思考與探索,以解決L4未知場(chǎng)景下的問題。

理想自動(dòng)駕駛框架

60bd65b0-fec3-11ee-a297-92fbcf53809c.png

來源:理想汽車

在端到端方案推進(jìn)的過程中,理想計(jì)劃把規(guī)劃/預(yù)測(cè)模型與感知模型進(jìn)行統(tǒng)一,并在原基礎(chǔ)上完成Temporal Planner的端到端,實(shí)現(xiàn)泊車/行車一體化。

2

數(shù)據(jù)成為端到端落地的關(guān)鍵

端到端方案的落地需要經(jīng)歷構(gòu)建研發(fā)團(tuán)隊(duì)、配置硬件設(shè)施、數(shù)據(jù)收集處理、算法訓(xùn)練與策略定制、驗(yàn)證評(píng)估、推廣量產(chǎn)等流程,部分場(chǎng)景痛點(diǎn)如表中所示:

端到端方案的部分場(chǎng)景痛點(diǎn)

60dc4930-fec3-11ee-a297-92fbcf53809c.png

來源:佐思汽研《2024年端到端自動(dòng)駕駛研究報(bào)告》

其中,端到端自動(dòng)駕駛方案中的一體化訓(xùn)練需要大量的數(shù)據(jù),因此其面臨的難點(diǎn)之一在于數(shù)據(jù)的收集和處理。

首先,數(shù)據(jù)的收集需要大量的時(shí)間和渠道,數(shù)據(jù)類型除了駕駛數(shù)據(jù)外還包括各種不同的道路、天氣和交通情況等場(chǎng)景數(shù)據(jù),其中在實(shí)際駕駛中駕駛員前方視野的駕駛數(shù)據(jù)相對(duì)便于收集,周圍方位的信息收集則難以保證。

再次,數(shù)據(jù)處理時(shí)需要設(shè)計(jì)數(shù)據(jù)提取維度、從海量的視頻片段中提取有效的特征、統(tǒng)計(jì)數(shù)據(jù)分布等,以支持大規(guī)模的數(shù)據(jù)訓(xùn)練。

元戎啟行

截至2024年3月,元戎啟行端到端自動(dòng)駕駛方案已經(jīng)獲得長(zhǎng)城汽車的定點(diǎn)項(xiàng)目,并與英偉達(dá)開展合作,預(yù)計(jì)2025年適配英偉達(dá)Thor芯片;在元戎啟行的規(guī)劃中,從傳統(tǒng)方案過渡到“端到端”自動(dòng)駕駛方案,經(jīng)歷傳感器前融合、去高精度地圖、感知決策控制三個(gè)模型一體化等環(huán)節(jié)。

元戎啟行在數(shù)據(jù)環(huán)節(jié)的布局

6105113a-fec3-11ee-a297-92fbcf53809c.png

來源:佐思汽研《2024年端到端自動(dòng)駕駛研究報(bào)告》

極佳科技

極佳科技的自動(dòng)駕駛世界模型DriveDreamer,具備場(chǎng)景生成、數(shù)據(jù)生成、駕駛動(dòng)作預(yù)測(cè)等功能;在場(chǎng)景/數(shù)據(jù)生成上,分為兩個(gè)步驟:

涉及單幀結(jié)構(gòu)化條件,引導(dǎo)DriveDreamer生成駕駛場(chǎng)景圖像,便于其理解結(jié)構(gòu)交通約束。

將其理解擴(kuò)展到視頻生成。利用連續(xù)的交通結(jié)構(gòu)條件,DriveDreamer輸出駕駛場(chǎng)景視頻,進(jìn)一步增強(qiáng)其對(duì)運(yùn)動(dòng)轉(zhuǎn)換的理解。

DriveDreamer的功能包括可連續(xù)駕駛視頻生成、與文本提示和結(jié)構(gòu)化交通限制無縫對(duì)齊

6122a984-fec3-11ee-a297-92fbcf53809c.png

來源:極佳科技

3

端到端方案加快具身機(jī)器人落地

除了自動(dòng)駕駛汽車,具身機(jī)器人是端到端方案另一個(gè)主流場(chǎng)景。從端到端自動(dòng)駕駛到機(jī)器人,需要構(gòu)建更加通用的世界模型,來適應(yīng)更加復(fù)雜、多元的現(xiàn)實(shí)使用場(chǎng)景,主流AGI(通用人工智能)發(fā)展的框架分為兩個(gè)階段:

階段一:基礎(chǔ)大模型理解和生成實(shí)現(xiàn)統(tǒng)一,進(jìn)一步與具身智能結(jié)合,形成統(tǒng)一世界模型;

階段二:世界模型+復(fù)雜任務(wù)的規(guī)控能力和抽象概念的歸納能力,逐步演化進(jìn)入交互AGI 1.0時(shí)代。

在世界模型落地的過程中,構(gòu)建端到端的VLA(Vision-Language-Action) 自主系統(tǒng)成為關(guān)鍵一環(huán)。VLA作為具身智能基礎(chǔ)大模型,能夠?qū)?D感知、推理和行動(dòng)無縫鏈接起來,形成一個(gè)生成式世界模型,并建立在基于3D的大型語言模型(LLM)之上,引入一組交互標(biāo)記以與環(huán)境進(jìn)行互動(dòng)。

3D-VLA解決方案

6142fbe4-fec3-11ee-a297-92fbcf53809c.png

來源:University of Massachusetts Amherst、MIT-IBM Watson AI Lab等機(jī)構(gòu)

截至2024年4月,部分采用端到端方案的具身機(jī)器人廠商如下:

部分具身機(jī)器人如何應(yīng)用端到端方案

615b550e-fec3-11ee-a297-92fbcf53809c.png

來源:佐思汽研《2024年端到端自動(dòng)駕駛研究報(bào)告》

以有鹿機(jī)器人為例,其具身智能大模型LPLM(Large Physical Language Model)為端到端的具身智能解決方案,通過自我標(biāo)注機(jī)制提升模型從未標(biāo)注數(shù)據(jù)中的學(xué)習(xí)效率和質(zhì)量,從而加深對(duì)世界的理解,進(jìn)而加強(qiáng)機(jī)器人的泛化能力與跨模態(tài)、跨場(chǎng)景、跨行業(yè)場(chǎng)景下的環(huán)境適應(yīng)性。

LPLM模型架構(gòu)

6185174a-fec3-11ee-a297-92fbcf53809c.png

來源:有鹿機(jī)器人

LPLM 將物理世界抽象化,確保該類信息與 LLM 里特征的抽象等級(jí)對(duì)齊,將物理世界中每一個(gè)所指的實(shí)體顯式建模為 token,編碼幾何、語義、運(yùn)動(dòng)學(xué)與意圖信息。

此外,LPLM 在自然語言指令的編碼中加入了 3D grounding,一定程度上彌補(bǔ)了自然語言不夠精確的缺陷;其解碼器能夠通過不斷預(yù)測(cè)未來的方式去學(xué)習(xí),從而加強(qiáng)了模型從海量無標(biāo)簽數(shù)據(jù)中學(xué)習(xí)的能力。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2566

    文章

    53008

    瀏覽量

    767619
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103669
  • 攝像頭
    +關(guān)注

    關(guān)注

    61

    文章

    4982

    瀏覽量

    98428
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93815
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    790

    文章

    14321

    瀏覽量

    170702

原文標(biāo)題:端到端智駕研究:E2E自動(dòng)駕駛發(fā)展現(xiàn)狀

文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Nullmax自動(dòng)駕駛最新研究成果入選ICCV 2025

    近日,國(guó)際計(jì)算機(jī)視覺大會(huì) ICCV 2025 正式公布論文錄用結(jié)果,Nullmax 感知團(tuán)隊(duì)在自動(dòng)駕駛方向的最新研究成果《HiP-AD
    的頭像 發(fā)表于 07-05 15:40 ?433次閱讀
    Nullmax<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>最新<b class='flag-5'>研究</b>成果入選ICCV 2025

    為什么自動(dòng)駕駛大模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)落地,(End-to-End)大模型也成為行業(yè)研究與應(yīng)用的熱門方向。相較于傳統(tǒng)
    的頭像 發(fā)表于 07-04 16:50 ?221次閱讀
    為什么<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有黑盒特性?

    數(shù)據(jù)標(biāo)注方案在自動(dòng)駕駛領(lǐng)域的應(yīng)用優(yōu)勢(shì)

    10-20TB,其中需要標(biāo)注的數(shù)據(jù)占比超過60%。在這樣的背景下,數(shù)據(jù)標(biāo)注方案應(yīng)運(yùn)而生,正在重塑自動(dòng)駕駛的數(shù)據(jù)生產(chǎn)范式。
    的頭像 發(fā)表于 06-23 17:27 ?297次閱讀

    自動(dòng)駕駛中基于規(guī)則的決策和大模型有何區(qū)別?

    自動(dòng)駕駛架構(gòu)的選擇上,也經(jīng)歷了從感知、決策控制、執(zhí)行的三段式架構(gòu)到現(xiàn)在火熱的大模型,尤其是在2024
    的頭像 發(fā)表于 04-13 09:38 ?2916次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中基于規(guī)則的決策和<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有何區(qū)別?

    東風(fēng)汽車推出自動(dòng)駕駛開源數(shù)據(jù)集

    近日,智能網(wǎng)聯(lián)汽車智駕數(shù)據(jù)空間構(gòu)建研討會(huì)暨中協(xié)會(huì)智能網(wǎng)聯(lián)汽車分會(huì)、數(shù)據(jù)分會(huì)2024度會(huì)議在上海舉辦。會(huì)上,東風(fēng)汽車發(fā)布行業(yè)規(guī)模最大、涵蓋125萬組高質(zhì)量數(shù)據(jù)的
    的頭像 發(fā)表于 04-01 14:54 ?633次閱讀

    2025汽車微電機(jī)及運(yùn)動(dòng)機(jī)構(gòu)行業(yè)研究報(bào)告

    研發(fā)布了《2025汽車微電機(jī)及運(yùn)動(dòng)機(jī)構(gòu)行業(yè)研究報(bào)告》。
    的頭像 發(fā)表于 02-20 14:14 ?1070次閱讀
    2025<b class='flag-5'>年</b>汽車微電機(jī)及運(yùn)動(dòng)機(jī)構(gòu)行業(yè)<b class='flag-5'>研究報(bào)告</b>

    2026至2030:Robotaxi趨向規(guī)?;?L3個(gè)人乘用車商業(yè)化新篇章開啟

    研發(fā)布《2025L3/L4自動(dòng)駕駛和初創(chuàng)企業(yè)研究報(bào)告
    的頭像 發(fā)表于 02-08 10:23 ?1815次閱讀
    2026至2030<b class='flag-5'>年</b>:Robotaxi趨向規(guī)?;?L3個(gè)人乘用車商業(yè)化新篇章開啟

    2024自動(dòng)駕駛行業(yè)熱點(diǎn)技術(shù)盤點(diǎn)

    自動(dòng)駕駛技術(shù)日新月異,每一都會(huì)有新的突破。2024自動(dòng)駕駛,更是出現(xiàn)了許多新的技術(shù)路線,其中包括城市NOA(Navigate on A
    的頭像 發(fā)表于 01-14 10:48 ?623次閱讀

    自動(dòng)駕駛域控研究:One board/One Chip方案將對(duì)汽車供應(yīng)鏈產(chǎn)生深遠(yuǎn)影響

    研發(fā)布了《2024-2025自動(dòng)駕駛域控制器
    的頭像 發(fā)表于 12-30 11:38 ?2211次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>域控<b class='flag-5'>研究</b>:One board/One Chip方案將對(duì)汽車供應(yīng)鏈產(chǎn)生深遠(yuǎn)影響

    自動(dòng)駕駛技術(shù)研究與分析

    編者語:「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù):C-0450,獲取本文參考報(bào)告:《自動(dòng)駕駛行業(yè)研究報(bào)告
    的頭像 發(fā)表于 12-19 13:07 ?899次閱讀

    爆火的如何加速智駕落地?

    編者語:「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù):C-0551,獲取本文參考報(bào)告:《智能汽車技術(shù)研究報(bào)告》pdf下載方式。 “
    的頭像 發(fā)表于 11-26 13:17 ?1163次閱讀
    爆火的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>如何加速智駕落地?

    連接視覺語言大模型與自動(dòng)駕駛

    自動(dòng)駕駛在大規(guī)模駕駛數(shù)據(jù)上訓(xùn)練,展現(xiàn)出很強(qiáng)的決策規(guī)劃能力,但是面對(duì)復(fù)雜罕見的駕駛場(chǎng)景,依然
    的頭像 發(fā)表于 11-07 15:15 ?710次閱讀
    連接視覺語言大模型與<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>

    Waymo利用谷歌Gemini大模型,研發(fā)自動(dòng)駕駛系統(tǒng)

    邁新步,為其機(jī)器人出租車業(yè)務(wù)引入了一種基于谷歌多模態(tài)大語言模型(MLLM)“Gemini”的全新訓(xùn)練模型——“多模態(tài)自動(dòng)駕駛模型”(EMMA)。
    的頭像 發(fā)表于 10-31 16:55 ?1731次閱讀

    Mobileye自動(dòng)駕駛解決方案的深度解析

    自動(dòng)駕駛技術(shù)正處于快速發(fā)展之中,各大科技公司和汽車制造商均在爭(zhēng)相布局,試圖在這個(gè)新興領(lǐng)域占據(jù)一席之地。Mobileye作為全球自動(dòng)駕駛技術(shù)的領(lǐng)軍企業(yè)之一,憑借其獨(dú)特的
    的頭像 發(fā)表于 10-17 09:35 ?841次閱讀
    Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>解決方案的深度解析

    實(shí)現(xiàn)自動(dòng)駕駛,唯有?

    ,去年行業(yè)主流方案還是輕高精地圖城區(qū)智駕,今年大家的目標(biāo)都瞄到了(End-to-End, E2E)。
    的頭像 發(fā)表于 08-12 09:14 ?1525次閱讀
    實(shí)現(xiàn)<b class='flag-5'>自動(dòng)駕駛</b>,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?