近日,在由北京市發(fā)展改革委、北京市科委中關(guān)村管委會、北京市經(jīng)信局、海淀區(qū)政府共同指導(dǎo)的2025人工智能計算大會智能駕駛創(chuàng)新與應(yīng)用論壇上,魔視智能乘用車事業(yè)部產(chǎn)品線副總經(jīng)理張崢發(fā)表《端到端智能駕駛演進(jìn)》主題演講。該論壇由智猩猩、車東西聯(lián)合承辦,在北京中關(guān)村國家自主創(chuàng)新示范區(qū)會議中心舉行。
張崢表示,魔視智能過去十年一直以AI驅(qū)動引領(lǐng)新一代產(chǎn)品技術(shù)迭代,目前在國內(nèi)及海外市場均獲得了積極的認(rèn)可及反饋,成為多家國內(nèi)頭部整車OEM的戰(zhàn)略及重點合作伙伴。面對智能駕駛新趨勢,魔視智能正積極推進(jìn)智駕大模型的研究與應(yīng)用。
從規(guī)則驅(qū)動到認(rèn)知驅(qū)動的技術(shù)演進(jìn)
張崢首先分析了傳統(tǒng)規(guī)劃控制(PNC)的局限性:"傳統(tǒng)PNC高度依賴感知結(jié)果,基于規(guī)則的決策邏輯難以泛化,規(guī)劃與感知解耦導(dǎo)致'信息斷層',軌跡生成過于保守,規(guī)則系統(tǒng)無法從數(shù)據(jù)中學(xué)習(xí)新行為。"
相比之下,端到端智能駕駛正朝著更加智能化的方向發(fā)展。張崢詳細(xì)比較了兩段式端到端和一段式端到端的技術(shù)路線。兩段式優(yōu)勢在于模塊清晰、可解釋性強(qiáng),但存在信息傳遞"瓶頸"、對感知誤差敏感等局限;一段式則能夠?qū)崿F(xiàn)感知與決策的強(qiáng)耦合優(yōu)化,具備更強(qiáng)的泛化能力,但可解釋性差、訓(xùn)練難度大。
快慢系統(tǒng)與VLA模型:讓車輛具備"思考"能力
張崢重點介紹了魔視智能的"快慢系統(tǒng)" 設(shè)計理念。"快系統(tǒng)處理實時駕駛?cè)蝿?wù),基于VLM的慢系統(tǒng)負(fù)責(zé)語義理解和深度決策,這種架構(gòu)讓車輛真正具備了思考能力?!?/p>
VLA(視覺語言行為)模型是一段式智能體的核心。"VLA系統(tǒng)能夠統(tǒng)一建模,實現(xiàn)端到端閉環(huán),具備強(qiáng)大的語義理解與推理能力,讓車輛真正具備認(rèn)知能力。"張崢表示,這將實現(xiàn)真正的"人機(jī)共駕"體驗。
世界模型:預(yù)見未來的關(guān)鍵
在世界模型方面,張崢指出其能夠"讓車輛知道過去也能預(yù)見未來"。世界模型具備強(qiáng)大的環(huán)境建模與預(yù)測能力,支持"以預(yù)測驅(qū)動決策"的智能駕駛,為端到端學(xué)習(xí)提供中間表示。 "世界模型的挑戰(zhàn)在于訓(xùn)練難度大、預(yù)測誤差累積、計算開銷大,但這正是我們重點突破的方向。"
魔視智能的端到端設(shè)計思路
張崢最后揭曉了魔視智能的端到端設(shè)計理念:"我們的目標(biāo)不僅是打造一個執(zhí)行者,更是要創(chuàng)造一個能夠理解環(huán)境、預(yù)測未來、自主決策并表達(dá)意圖的智能體。"
魔視智能采用金字塔式的算法模型迭代戰(zhàn)略:以結(jié)構(gòu)化感知+可解釋規(guī)劃控制作為安全底座,構(gòu)建端到端及VLM模型提升泛化能力,最終通過認(rèn)知驅(qū)動的VLA視覺語言大模型解決泛化問題和數(shù)據(jù)依賴難題。
-
人工智能
+關(guān)注
關(guān)注
1811文章
49485瀏覽量
257971 -
智能駕駛
+關(guān)注
關(guān)注
5文章
2892瀏覽量
50617 -
魔視智能
+關(guān)注
關(guān)注
0文章
49瀏覽量
1618
原文標(biāo)題:魔視智能張崢:端到端智能駕駛演進(jìn),VLA模型將成新范式
文章出處:【微信號:motovis,微信公眾號:魔視智能MOTOVIS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論