chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

小鵬和理想均押注VLA,兩者技術(shù)各有啥特色?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2026-03-19 08:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]隨著高級輔助駕駛功能越發(fā)完善,高速NOA、城市NOA的使用已經(jīng)較為普遍,這其中離不開VLA(視覺-語言-動作)模型的推動。

VLA大模型的出現(xiàn),也標(biāo)志著行業(yè)正式從“感知識別”邁向了“理解決策”。以前的智駕系統(tǒng)更像是一個經(jīng)驗(yàn)豐富的“反射神經(jīng)”,看到紅燈就停,看到障礙物就繞,但它并不理解為什么要這么做。

VLA模型把人類的常識、邏輯推理能力與駕駛行為直接掛鉤。通過將海量的圖像數(shù)據(jù)與語言理解能力結(jié)合,模型不再只是計(jì)算像素點(diǎn),而是像人類一樣去“觀察”并“理解”物理世界的因果關(guān)系,最后直接輸出方向盤轉(zhuǎn)角、剎車力度等控制指令。這種從輸入到輸出的跨越,讓車具備了處理從未見過的新場景的能力。

簡單理解下VLA模型,其就是讓車輛做到了“看懂世界、理解意圖、做出動作”這三件事。

wKgZPGm7ShaAb2Y-AACupHq5c98188.jpg

圖片源自:網(wǎng)絡(luò)

最近理想汽車和小鵬也相繼發(fā)布了最新的VLA模型,讓自動駕駛的技術(shù)競爭進(jìn)入了一個全新的階段。那這兩家發(fā)布的VLA模型都有哪些特色?都就解決了自動駕駛的哪些問題?今天智駕最前沿就帶大家來聊一聊。

在開始今天的話題前,先申明一下,本次內(nèi)容的素材均源自于理想與小鵬發(fā)布的內(nèi)容,若內(nèi)容出現(xiàn)歧義或存在錯誤,也歡迎大家評論區(qū)補(bǔ)充。

wKgZO2m7SheAfOhoAAAQo00DEvw960.jpg

理想MindVLA-o1,在隱空間里推演未來

從理想的MindVLA-o1的介紹中來看,MindVLA-o1偏“體系化設(shè)計(jì)”。它不只是一個模型,而是一整套從數(shù)據(jù)、模型到訓(xùn)練和部署的閉環(huán)系統(tǒng)。

wKgZPGm7SheAArBmAABTJedny0U536.jpg

圖片源自:理想汽車微信公眾號

理想明確引入了3D建模能力。通過視覺模型結(jié)合激光雷達(dá)點(diǎn)云作為幾何提示,讓模型在內(nèi)部形成更穩(wěn)定的空間結(jié)構(gòu)表示。這一點(diǎn)和純視覺路線相比,更強(qiáng)調(diào)“物理一致性”,也更利于處理如遮擋、坡道、非規(guī)則障礙物等復(fù)雜空間關(guān)系。

理想還在MindVLA-o1中引入了預(yù)測式隱世界模型,可以在隱空間中高效模擬未來。簡單理解,就是讓模型不僅可以看當(dāng)前,還能在內(nèi)部模擬未來幾秒的場景變化。對于自動駕駛來說,很多駕駛動作本質(zhì)上就是對未來的預(yù)測,這種能力如果做得好,可以顯著提升決策穩(wěn)定性。

在行為生成部分,理想還采用了VLA-MoE(混合專家模型)+Action Expert(動作專家)、并行解碼(Parallel Decoding)以及Discrete Diffusion(離散擴(kuò)散)等更結(jié)構(gòu)化的方式。這類設(shè)計(jì)的目標(biāo)很明確,就是讓輸出軌跡在時間上更連續(xù),在物理上更合理。

理想還投入大量精力在仿真和強(qiáng)化學(xué)習(xí)上,通過可控環(huán)境進(jìn)行大規(guī)模訓(xùn)練,再結(jié)合真實(shí)數(shù)據(jù)閉環(huán)。這種方式的優(yōu)勢是可以覆蓋大量長尾場景,而不完全依賴真實(shí)道路采集。

同時,理想在模型設(shè)計(jì)階段就考慮硬件限制,通過軟硬件協(xié)同去優(yōu)化部署效率,這對于大模型落地是非常關(guān)鍵的一步。

整體來看,理想MindVLA-o1是一條更偏長期能力構(gòu)建的路線,強(qiáng)調(diào)模型結(jié)構(gòu)、訓(xùn)練體系和工程閉環(huán)的完整性。

wKgZO2m7ShiANe6wAAAR42n7O-I305.jpg

小鵬第二代VLA,更偏產(chǎn)品化和數(shù)據(jù)閉環(huán)

小鵬的第二代VLA更強(qiáng)調(diào)盡快在真實(shí)用戶場景中跑起來。它的核心思路是盡量減少規(guī)則依賴,用大模型去直接學(xué)習(xí)駕駛行為,并通過車端數(shù)據(jù)不斷迭代。

其一個比較關(guān)鍵的特點(diǎn)是對連續(xù)視頻流的使用。相比傳統(tǒng)只用關(guān)鍵幀或抽象特征,小鵬更強(qiáng)調(diào)時間連續(xù)的信息輸入,這讓模型在處理前車減速、行人橫穿等動態(tài)場景時更穩(wěn)定,決策不會出現(xiàn)明顯跳變。

在感知中小鵬并沒有強(qiáng)調(diào)復(fù)雜的顯式三維重建,而是更依賴模型自身去學(xué)習(xí)空間關(guān)系。這種做法的好處是結(jié)構(gòu)更簡單,端到端程度更高,但代價(jià)是對數(shù)據(jù)規(guī)模和模型能力依賴更強(qiáng)。

小鵬第二代VLA另一個明顯特征是“分層產(chǎn)品策略”(含三個版本)。高算力平臺承載完整能力,再通過蒸餾壓縮到中低算力車型。這其實(shí)是一個典型的工程折中,其既保證了技術(shù)上限,又能快速規(guī)模化落地。

從體驗(yàn)指標(biāo)來看,小鵬更關(guān)注接管次數(shù)、重剎等用戶感知明顯的指標(biāo)。這說明它的優(yōu)化目標(biāo)更偏“駕駛是否自然、是否讓人放心”,而不是單一的技術(shù)指標(biāo)。

此外,小鵬還強(qiáng)調(diào)“軟硬結(jié)合”,通過自研的圖靈AI芯片,他們把硬件的有效算力發(fā)揮到了極致。在小鵬的架構(gòu)中,模型不再是一個孤立的算法,而是與芯片指令集、AI編譯器深度綁定的整體。這種設(shè)計(jì)讓模型能以極高的頻率去吞吐視頻流數(shù)據(jù),確保了在復(fù)雜路況下的實(shí)時響應(yīng)速度。

整體來看,這是一條以真實(shí)數(shù)據(jù)驅(qū)動為核心、強(qiáng)調(diào)快速迭代和規(guī)模落地的路線。小鵬的技術(shù)邏輯其實(shí)也非常清晰,既然物理世界的數(shù)據(jù)量巨大且連續(xù),那就通過最強(qiáng)悍的算力底座和最高效的模型架構(gòu),直接去消化這些海量信息。

wKgZO2m7ShmAeBrhAAASG3BOmsQ748.jpg

智駕最前沿觀點(diǎn)?

對比這兩家的方案,智駕最前沿以為它們在解決自動駕駛上限問題時選擇了不同的發(fā)力點(diǎn)。理想試圖通過構(gòu)建完美的物理模型和模擬器,讓車學(xué)會如何像人一樣去思考物理定律,從而在未知的環(huán)境中找到答案。它的優(yōu)勢在于它對場景的還原度和對未來的預(yù)測精度,這讓它的車在面對復(fù)雜路口和人車交互時,表現(xiàn)得更加冷靜且符合邏輯。

而小鵬則更看重系統(tǒng)的爆發(fā)力和執(zhí)行效率。其強(qiáng)調(diào)大模型帶來的能力提升必須建立在高效的算力流轉(zhuǎn)基礎(chǔ)之上,所以他們把大量的精力花在了如何讓大模型在有限的端側(cè)設(shè)備上跑得更順暢、吞吐量更大。

如果說理想是在提升車的“智商”,那么小鵬就是在通過重構(gòu)身體結(jié)構(gòu)(芯片與編譯器)來釋放大腦的潛力。

wKgZPGm7ShqAHl8qAAadZZ1MXyI307.jpg

圖片源自:網(wǎng)絡(luò)

從這兩家發(fā)布的技術(shù)中,我們也可以看到一個清晰的趨勢,自動駕駛正在加速向具身智能演進(jìn)。無論是理想的“數(shù)字大腦”類比,還是小鵬對“物理AI”基座的重構(gòu),其實(shí)都在表達(dá)同一個觀點(diǎn),那就是車只是AI介入物理世界的第一個載體。

未來的核心競爭力,不再是某一個功能可以做到什么程度,而是誰能構(gòu)建出一套通用性最強(qiáng)、自進(jìn)化速度最快的底層架構(gòu)。

在我看來,目前的難點(diǎn)其實(shí)在于端側(cè)部署的效率紅線。即便模型再聰明,如果在車端運(yùn)行時的延遲過高,一切都是空談。因此,小鵬這種從底層芯片開始重構(gòu)的路徑,在長遠(yuǎn)來看具有極強(qiáng)的技術(shù)護(hù)城河。而理想通過世界模型實(shí)現(xiàn)的閉環(huán)強(qiáng)化學(xué)習(xí),則在數(shù)據(jù)獲取成本和模型進(jìn)化效率上找到了平衡。

未來這兩條路線可能會殊途同歸,即在擁有強(qiáng)大硬件底座的基礎(chǔ)上,通過世界模型進(jìn)行大規(guī)模的自我進(jìn)化。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • Vla
    Vla
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    5904
  • 自動駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14914

    瀏覽量

    180283
  • 小鵬
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    1463
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    2500 TOPS!特斯拉HW5智駕算力怪獸突擊,國產(chǎn)VLA火速進(jìn)化

    芯片水平。與此同時,國內(nèi)車企如小、理想等也在加速自身技術(shù)進(jìn)化,推出基于VLA的新一代智能駕駛解決方案。 ? 未來,特斯拉能否憑借HW5與FSD技術(shù)
    的頭像 發(fā)表于 06-20 09:05 ?8457次閱讀
    2500 TOPS!特斯拉HW5智駕算力怪獸突擊,國產(chǎn)<b class='flag-5'>VLA</b>火速進(jìn)化

    【飛凌嵌入式RV1126B開發(fā)板】+款開發(fā)板之比較

    由圖可以看出看出,兩者采用組合式結(jié)構(gòu)設(shè)計(jì),所不同是飛凌開發(fā)板所使用的核心板是采用齒孔引腳被焊接到功能底板,而靈眸開發(fā)板是采用插接式來連接核心板。 在供電方式上,兩者均是采用外部的電源適配器來供電,所
    發(fā)表于 03-05 23:32

    VLA模型是基于預(yù)置規(guī)則來指導(dǎo)行動嗎?

    [首發(fā)于智駕最前沿微信公眾號]今天繼續(xù)來回答小伙伴的提問,最近有一位小伙伴提問,VLA模型中的理解是不是也基于一些預(yù)置的規(guī)則指導(dǎo)行動的?其實(shí)這個問題非常值得討論,今天智駕最前沿就帶大家詳細(xì)聊一聊
    的頭像 發(fā)表于 12-25 09:22 ?1277次閱讀
    <b class='flag-5'>VLA</b>模型是基于預(yù)置規(guī)則來指導(dǎo)行動嗎?

    VLA與世界模型有什么不同?

    Language Action,VLA),另一些則致力于構(gòu)建并應(yīng)用世界模型(World Model)。這種路徑有什么不同? 什么是VLA,什么是世界模型 先說說VLA。
    的頭像 發(fā)表于 12-17 09:13 ?677次閱讀
    <b class='flag-5'>VLA</b>與世界模型有什么不同?

    VLA能解決自動駕駛中的哪些問題?

    、語言表達(dá)和動作控制這三整合到一個統(tǒng)一的模型框架中。 與傳統(tǒng)自動駕駛系統(tǒng)將感知、預(yù)測、規(guī)劃、控制拆解為多個獨(dú)立模塊的做法不同,VLA可以縮短“看見什么”和“如何行動”之間的鴻溝,構(gòu)建一個能直接將視覺輸入和語言描述映射到具體動作或策略的模型。 這類模型通常
    的頭像 發(fā)表于 11-25 08:53 ?520次閱讀
    <b class='flag-5'>VLA</b>能解決自動駕駛中的哪些問題?

    VLA和世界模型,誰才是自動駕駛的最優(yōu)解?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)發(fā)展,其實(shí)現(xiàn)路徑也呈現(xiàn)出種趨勢,一邊是以理想、小、小米為代表的VLA(視覺—語言—行動)模
    的頭像 發(fā)表于 11-05 08:55 ?826次閱讀
    <b class='flag-5'>VLA</b>和世界模型,誰才是自動駕駛的最優(yōu)解?

    谷歌AlphaEarth和維智時空AI大模型的技術(shù)路徑

    谷歌AlphaEarth和維智時空AI大模型在應(yīng)用場景和技術(shù)實(shí)現(xiàn)上各有側(cè)重,但兩者在底層技術(shù)理念上存在顯著共性。
    的頭像 發(fā)表于 10-22 14:48 ?941次閱讀

    種TVS有不同?

    當(dāng)我們查看TVS二極管的規(guī)格書,常會看到有以下種種引腳功能標(biāo)識圖:對于初學(xué)者,看到感到疑惑,他們一樣嗎?他們有區(qū)別?為啥有的個尖頭往外,陽極連在一起,有的個尖頭往里,陰極連在一
    的頭像 發(fā)表于 09-15 20:27 ?852次閱讀
    這<b class='flag-5'>兩</b>種TVS有<b class='flag-5'>啥</b>不同?

    VLA,是完全自動駕駛的必經(jīng)之路?

    電子發(fā)燒友網(wǎng)報(bào)道 (文/梁浩斌)最近,智駕領(lǐng)域又出現(xiàn)多個“新名詞”,比如蔚來推出的NWM、多家車企和智駕供應(yīng)商都在宣傳的VLA。實(shí)際上,從各家的路線來看,隨著更大算力的芯片,比如小、蔚來自研的智駕
    的頭像 發(fā)表于 06-18 00:06 ?9448次閱讀

    元戎啟行周光:VLA模型將于2025年第三季度量產(chǎn)

    2025年6月11日,元戎啟行CEO周光受邀出席2025年火山引擎Force原動力大會,宣布元戎啟行將攜手火山引擎,基于豆包大模型,共同研發(fā)VLA等前瞻技術(shù),打造物理世界的Agent。同時,周光宣布
    發(fā)表于 06-12 09:45 ?1331次閱讀
    元戎啟行周光:<b class='flag-5'>VLA</b>模型將于2025年第三季度量產(chǎn)

    CDS與SDS供液系統(tǒng)兩者之間的區(qū)別

    CDS(中央化學(xué)液供應(yīng)系統(tǒng))與SDS(自動供液系統(tǒng))在半導(dǎo)體、醫(yī)療等領(lǐng)域均有應(yīng)用,但兩者在功能定位、技術(shù)特點(diǎn)及應(yīng)用場景上存在顯著差異。以下是兩者的核心區(qū)別: 1. 功能定位與系統(tǒng)架構(gòu) CDS(中央
    的頭像 發(fā)表于 05-12 09:10 ?2844次閱讀

    特斯拉FSD、蔚來NAD、小XNGP、華為ADS 2.0、理想AD Max、百度Apollo Lite等系統(tǒng)按技術(shù)點(diǎn)進(jìn)行對比匯總

    主流智能駕駛系統(tǒng)從感知方案到算法架構(gòu)各有特色,下面對特斯拉FSD、蔚來NAD、小XNGP、華為ADS 2.0、理想AD Max、百度Apollo Lite等系統(tǒng)按技術(shù)點(diǎn)進(jìn)行對比匯總。
    的頭像 發(fā)表于 05-10 15:15 ?4909次閱讀

    時鐘電路與晶振電路兩者的區(qū)別有哪些

    在數(shù)字電子系統(tǒng)設(shè)計(jì)中,時鐘電路與晶振電路是個高頻出現(xiàn)的概念。雖然二緊密相關(guān)且常被協(xié)同討論,但從功能定位、電路構(gòu)成到應(yīng)用場景都存在本質(zhì)差異。本文將從技術(shù)原理出發(fā),系統(tǒng)解析兩者的區(qū)別。
    的頭像 發(fā)表于 05-05 15:19 ?2197次閱讀

    嵌入式和單片機(jī)的區(qū)別?一文簡單明了的給你講透兩者技術(shù)本質(zhì)!

    上周有個做智能硬件創(chuàng)業(yè)的朋友問我:"我們產(chǎn)品用的是STM32單片機(jī),但方案商總說要做嵌入式系統(tǒng),這兩者到底有區(qū)別?"這個問題其實(shí)戳中了大多數(shù)電子工程師的認(rèn)知盲區(qū)。作為深耕物聯(lián)網(wǎng)
    的頭像 發(fā)表于 04-21 16:10 ?2979次閱讀
    嵌入式和單片機(jī)的區(qū)別?一文簡單明了的給你講透<b class='flag-5'>兩者</b>的<b class='flag-5'>技術(shù)</b>本質(zhì)!

    理想汽車推出全新自動駕駛架構(gòu)

    2025年3月18日,理想汽車自動駕駛技術(shù)研發(fā)負(fù)責(zé)人賈在NVIDIA GTC 2025發(fā)表主題演講《VLA:邁向自動駕駛物理智能體的關(guān)鍵一步》,分享了
    的頭像 發(fā)表于 03-19 14:12 ?1129次閱讀