chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語言模型是否是自動駕駛的必選項?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-11-14 16:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]自動駕駛的發(fā)展并非一成不變,在傳統(tǒng)自動駕駛系統(tǒng)中,通常采用分層的體系架構(gòu)。最底層是感知層,負責將攝像頭、雷達、激光雷達等傳感器數(shù)據(jù)轉(zhuǎn)化為車輛能夠“看到”的環(huán)境信息;其上是跟蹤與狀態(tài)估計層,負責在時間維度關(guān)聯(lián)感知結(jié)果,推斷目標的速度與運動趨勢;預測層則基于當前狀態(tài),估計其他道路使用者的未來可能軌跡;決策與路徑規(guī)劃層綜合所有信息,生成車輛執(zhí)行的行動策略;最后,控制層將規(guī)劃結(jié)果轉(zhuǎn)化為具體的油門、剎車和轉(zhuǎn)向指令。

這種結(jié)構(gòu)化設(shè)計具有顯著優(yōu)勢,每一層在延遲、可靠性和驗證方式上要求不同,分層使得模塊可獨立優(yōu)化、便于問題定位。如傳感器異常可回溯至感知層排查,控制環(huán)路不穩(wěn)可對控制器單獨壓力測試。模塊化還允許在關(guān)鍵閉環(huán)中使用已嚴格驗證的算法,而將依賴常識推理的任務交給更靈活的模型處理,從而兼顧實時控制的安全性與語義層面的智能判斷。

除了結(jié)構(gòu)化的架構(gòu)外,端到端的概念被越來越多企業(yè)多推崇。所謂端到端,就是把感知到控制盡可能用大模型學習出來。端到端理論上可以減少模塊之間的誤差累積,學出的行為可能更連貫、更“自然”。但這種路徑帶來的問題也很明顯,可解釋性差,驗證起來很難,而且需要極大量、極多樣的數(shù)據(jù)來覆蓋各種罕見場景。因此在實際的技術(shù)方案中,會在最需要確定性的地方保留傳統(tǒng)可驗證方法,而在需要語義理解或大范圍推理的地方引入更靈活的模型。

wKgZPGkW5uGAG95PAAAQo00DEvw066.jpg

語言模型放進自動駕駛有何作用?

語言模型擅長處理和生成語言、能做基于大規(guī)模語料的推理和常識補全,把它用在自動駕駛里,多數(shù)時候是放在語義層和生成/解釋層,而不是直接替代感知或控制那類需要精確幾何計算的工作。

在一些交通場景中,感知模塊會告訴系統(tǒng)“有若干個物體在前方”,但把這些物體上升為可以驅(qū)動決策的語義信息,往往需要把感知結(jié)果和道路規(guī)則、施工通告、臨時交通標志等背景信息結(jié)合起來。語言模型擅長把結(jié)構(gòu)化的感知結(jié)果和文本化的知識聯(lián)系起來,輸出更接近人類理解的描述。換句話說,它能把“看到的點”變成“能讀懂的語義”,這對處理臨時路況、復雜標識或人類語言說明很有幫助。

語言模型在高層策略描述上也可以發(fā)揮巨大作用。遇到交通參與者復雜互動的場景,系統(tǒng)除了需要給出一條可執(zhí)行軌跡,有時也需要說明為什么選擇這條軌跡、有哪些可替代方案以及這些方案的語義判斷依據(jù)。語言模型可以把這些理由或方案用自然語言或預定義模板羅列出來,便于運維人員審閱或作為人機交互的解釋輸出。這里的關(guān)鍵是模型輸出的是“解釋”和“備選方案”,而不是把解釋當作直接可執(zhí)行的指令。

語言模型在自動駕駛的數(shù)據(jù)與仿真領(lǐng)域也展現(xiàn)出重要價值。為了構(gòu)建更魯棒的自動駕駛系統(tǒng),尤其是在覆蓋罕見的長尾場景方面,仿真與合成數(shù)據(jù)不可或缺。語言模型能夠自動生成多樣化的場景描述、對話腳本及測試用例,并通過場景生成器將這些語義內(nèi)容轉(zhuǎn)化為可執(zhí)行的仿真環(huán)境。借助這一能力,系統(tǒng)能夠在虛擬環(huán)境中高效復現(xiàn)現(xiàn)實中難以采集的極端情況,從而顯著提升訓練與驗證的覆蓋范圍。

此外,語言模型在將復雜技術(shù)內(nèi)容轉(zhuǎn)化為自然語言方面也具有突出優(yōu)勢。無論是車內(nèi)語音交互、對外部管理系統(tǒng)的自然語言接口,還是在事后將故障日志整理成易于理解的報告,語言模型都能發(fā)揮關(guān)鍵作用。對于普通乘客或維護團隊而言,將復雜的傳感器數(shù)據(jù)與決策過程轉(zhuǎn)化為一句清晰易懂的說明,遠比直接呈現(xiàn)原始數(shù)據(jù)更具實用價值。

wKgZPGkW5uKAEpzTAAAR42n7O-I147.jpg

語言模型為什么不能直接替代核心駕駛技術(shù)?

把能做的講清楚之后,有必要把不能做的也講明白。語言模型的本質(zhì)決定了它不可能完全替代那些需要精確數(shù)值計算、實時閉環(huán)控制和可證明性證明的環(huán)節(jié)。

語言模型輸出的概率性本質(zhì)決定了其生成內(nèi)容雖然通常連貫合理,卻未必完全符合物理事實。尤其在信息不完整或存在沖突的情況下,模型可能生成看似合理但實際錯誤的結(jié)論。由于自動駕駛系統(tǒng)對判斷錯誤的容忍度極低,任何不準確輸出都可能引發(fā)嚴重后果,因此將語言模型的自由生成結(jié)果直接用于安全關(guān)鍵決策具有較高風險。

實時性與算力限制是另一重要約束。車輛在動態(tài)道路環(huán)境中通常需要在幾十至幾百毫秒內(nèi)完成決策與控制。然而,當前大規(guī)模語言模型的推理過程仍對計算資源有較高需求,難以在車端直接實現(xiàn)全尺寸模型的實時響應。盡管可采用模型壓縮、知識蒸餾或?qū)S糜布仁侄芜M行優(yōu)化,但這些方法往往伴隨性能損失或帶來更復雜的工程部署問題。

模型的“接地”能力同樣至關(guān)重要,即輸出必須嚴格基于當前傳感器數(shù)據(jù)與物理約束。語言模型的知識主要來源于離線訓練語料,而駕駛決策高度依賴如幾何關(guān)系、速度與動力學狀態(tài)等實時感知信息。要實現(xiàn)語義推理與感知事實的對齊,必須建立可靠的多模態(tài)輸入機制,將圖像、點云等感知數(shù)據(jù)以低損失方式傳遞給模型,并確保其輸出不脫離實際觀測。這類多模態(tài)接地機制的工程實現(xiàn)難度較高,容易產(chǎn)生語義推斷與物理現(xiàn)實之間的不一致。

在法規(guī)與系統(tǒng)驗證層面,自動駕駛也必須滿足嚴格的測試與合規(guī)要求,需要證明系統(tǒng)在各種場景下的行為可控、可測。語言模型的黑箱特性使其難以提供形式化、數(shù)學化的安全保證。因此,在現(xiàn)有工程實踐中,通常將最高風險的閉環(huán)控制任務交由可驗證的小型模塊處理,而語言模型的輸出則多作為輔助信息或解釋性內(nèi)容使用,以此在發(fā)揮其智能優(yōu)勢的同時確保系統(tǒng)的整體安全性與可認證性。

wKgZPGkW5uOAKZc9AAASG3BOmsQ312.jpg

系統(tǒng)集成時有哪些看起來不起眼但很關(guān)鍵的細節(jié)?

在將語言模型實際集成為系統(tǒng)組件時,必須對一系列工程細節(jié)加以周密考慮。這些細節(jié)雖看似瑣碎,卻直接關(guān)系到系統(tǒng)能否安全、穩(wěn)定地運行。

接口設(shè)計需要明確約束。系統(tǒng)里要事先定義好語言模型輸出的格式和語義范圍,避免模型隨意生成不可解析的文本。常見的做法是把模型的回復限定到一套事先定義好的模板或標簽集合里,然后再由驗證模塊把這些輸出轉(zhuǎn)成下層可執(zhí)行的指令。這樣做的目的在于把概率性語言輸出變成工程上可控的信號,防止上層的自由發(fā)揮直接影響控制層的安全邊界。

多模態(tài)數(shù)據(jù)如何供給模型也要慎重考慮。感知模塊產(chǎn)出的信息形式很多樣,包括稠密圖像、稀疏點云和時間序列軌跡等。想把這些異構(gòu)數(shù)據(jù)有效地傳給以文本為主的模型,有些團隊會把結(jié)構(gòu)化信息符號化成短文本描述后再喂給模型,這樣雖然簡單但會丟失細節(jié)。還有一些會采用多模態(tài)編碼器,把圖像或點云映射到與語言兼容的嵌入空間,這樣信息保留更好,但實現(xiàn)和部署復雜度更高。

此外,對模型輸出進行校驗的機制也必不可少。校驗可以是規(guī)則驅(qū)動的,也可以是用小型判別模型來做。無論采用哪種方式,目標都是在把語言模型的建議傳給下層執(zhí)行器之前,先評估其可執(zhí)行性、安全性和與當前感知事實的一致性。在實際設(shè)計時,經(jīng)常把這個校驗器設(shè)計成一個獨立模塊,只有通過校驗的輸出才能被轉(zhuǎn)化為規(guī)劃器能夠接受的約束或指令。

評測體系要擴展,不能只靠傳統(tǒng)指標。在引入語言模型之后,評測不再僅限于感知精度或軌跡偏差,還要關(guān)注語義穩(wěn)定性、輸出一致性和與感知事實的一致性。評測用例需要刻意設(shè)計能誘發(fā)模型“編故事”的情形,看模型在信息不全、信息沖突或極端擾動下會不會產(chǎn)生不合邏輯的結(jié)論。此外把模型放進閉環(huán)仿真環(huán)境里進行壓力測試也是非常必要的,只有在大量擾動和邊界條件下通過檢驗,才能說明整體系統(tǒng)在這些維度上的魯棒性。

部署架構(gòu)的權(quán)衡很多時候決定整體成敗。把大模型放在云端能利用強算力,但會引入網(wǎng)絡(luò)延遲和連通性風險;把模型盡量壓到車端能降低延遲但會受限于硬件和能耗;采用邊緣與云配合能兼顧兩者卻增加系統(tǒng)復雜性。因此,需要根據(jù)不同功能的實時性和安全等級來決定哪部分邏輯允許云端參與、哪部分必須留在車端,并且為各種網(wǎng)絡(luò)和硬件故障設(shè)計回退策略。

wKgZPGkW5uSAXrF8AAASAJELks8706.jpg

最后的話

語言模型是一個擅長語義理解、生成文本和做常識推理的工具,把它用在自動駕駛里能在很多非實時或者語義密集的環(huán)節(jié)發(fā)揮很大作用。典型的落地場景包括把感知結(jié)果轉(zhuǎn)成語義描述、為復雜交互場景提供可讀的策略說明、在仿真和數(shù)據(jù)生成里擴充長尾樣本,以及把復雜技術(shù)信息以人能讀懂的方式輸出給乘客或運維人員。

同時也要明白,語言模型不適合替代那些要求嚴格實時性、精確幾何推導或需要數(shù)學證明的控制環(huán)路。它有生成概率性的本質(zhì),可能在信息不足的情況下給出不準確的結(jié)論;它對算力和延遲敏感,直接在車端做全尺寸推理現(xiàn)實上不容易;它與實際感知的接地工作工程量大,必須有專門的接口和校驗機制。監(jiān)管和驗證的要求更是限制了把語言模型當成黑箱來承擔安全關(guān)鍵職責。

對于語言模型是否應成為自動駕駛的必選項,關(guān)鍵在于厘清其適用的具體場景、使用方式及相應的風險管控機制。我們更應將語言模型視為一種工具,在工程實踐中明確其邊界,將高風險的實時控制閉環(huán)留給可驗證的傳統(tǒng)模塊,而把語言模型的輸出定位為解釋信息、輔助提示或非實時決策支持。這種分工方式既符合系統(tǒng)安全要求,也體現(xiàn)了工程落地的務實邏輯。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    570

    瀏覽量

    11246
  • 自動駕駛
    +關(guān)注

    關(guān)注

    791

    文章

    14659

    瀏覽量

    176141
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    VLA能解決自動駕駛中的哪些問題?

    [首發(fā)于智駕最前沿微信公眾號]很多從事自動駕駛的小伙伴應該對VLA這個概念已經(jīng)非常熟悉了。VLA即“Visual-Language-Action”(視覺—語言—動作)模型,它的核心是將視覺信息
    的頭像 發(fā)表于 11-25 08:53 ?130次閱讀
    VLA能解決<b class='flag-5'>自動駕駛</b>中的哪些問題?

    模型中常提的快慢思考會對自動駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺語言模型和世界模型的全新自動駕駛技術(shù)架構(gòu)標志著其全棧自研的智能
    的頭像 發(fā)表于 11-22 10:59 ?2238次閱讀
    大<b class='flag-5'>模型</b>中常提的快慢思考會對<b class='flag-5'>自動駕駛</b>產(chǎn)生什么影響?

    VLA和世界模型,誰才是自動駕駛的最優(yōu)解?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)發(fā)展,其實現(xiàn)路徑也呈現(xiàn)出兩種趨勢,一邊是以理想、小鵬、小米為代表的VLA(視覺—語言—行動)模型路線;另一邊則是以華為、蔚來為主導的世界模型
    的頭像 發(fā)表于 11-05 08:55 ?449次閱讀
    VLA和世界<b class='flag-5'>模型</b>,誰才是<b class='flag-5'>自動駕駛</b>的最優(yōu)解?

    自動駕駛上常提的VLA與世界模型有什么區(qū)別?

    自動駕駛中常提的VLA,全稱是Vision-Language-Action,直譯就是“視覺-語言-動作”。VLA的目標是把相機或傳感器看到的畫面、能理解和處理自然語言的大模型能力,和最
    的頭像 發(fā)表于 10-18 10:15 ?715次閱讀

    西井科技端到端自動駕駛模型獲得國際認可

    近日,西井科技AI創(chuàng)研團隊在國際權(quán)威自動駕駛算法榜單NAVSIM v2中脫穎而出,憑借創(chuàng)新的端到端自動駕駛模型,以綜合得分48.759的成績榮登榜單全球第二位,并在多個關(guān)鍵安全指標上取得第一,充分彰顯西井科技在
    的頭像 發(fā)表于 10-15 17:20 ?1024次閱讀

    自動駕駛中Transformer大模型會取代深度學習嗎?

    持續(xù)討論。特別是在自動駕駛領(lǐng)域,部分廠商開始嘗試將多模態(tài)大模型(MLLM)引入到感知、規(guī)劃與決策系統(tǒng),引發(fā)了“傳統(tǒng)深度學習是否已過時”的激烈爭論。然而,從技術(shù)原理、算力成本、安全需求與實際落地路徑等維度來看,Transforme
    的頭像 發(fā)表于 08-13 09:15 ?3888次閱讀
    <b class='flag-5'>自動駕駛</b>中Transformer大<b class='flag-5'>模型</b>會取代深度學習嗎?

    為什么自動駕駛端到端大模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)落地,端到端(End-to-End)大模型也成為行業(yè)研究與應用的熱門方向。相較于傳統(tǒng)自動駕駛系統(tǒng)中的模塊化結(jié)構(gòu),端到端模型嘗試直接從感知輸
    的頭像 發(fā)表于 07-04 16:50 ?569次閱讀
    為什么<b class='flag-5'>自動駕駛</b>端到端大<b class='flag-5'>模型</b>有黑盒特性?

    卡車、礦車的自動駕駛和乘用車的自動駕駛在技術(shù)要求上有何不同?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛技術(shù)的發(fā)展,讓組合輔助駕駛得到大量應用,但現(xiàn)在對于自動駕駛技術(shù)的宣傳,普遍是在乘用車領(lǐng)域,而對于卡車、礦車的自動駕駛發(fā)展,卻鮮有提及。其實在卡車、
    的頭像 發(fā)表于 06-28 11:38 ?678次閱讀
    卡車、礦車的<b class='flag-5'>自動駕駛</b>和乘用車的<b class='flag-5'>自動駕駛</b>在技術(shù)要求上有何不同?

    自動駕駛中常提的世界模型是個啥?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的不斷成熟,車輛需要在復雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見”周圍的世界,還要能“理解”和“推測”未來的變化。世界模型可以被看作一種
    的頭像 發(fā)表于 06-24 08:53 ?691次閱讀
    <b class='flag-5'>自動駕駛</b>中常提的世界<b class='flag-5'>模型</b>是個啥?

    新能源車軟件單元測試深度解析:自動駕駛系統(tǒng)視角

    焦點是否落在目標物體上。某自動駕駛公司借此發(fā)現(xiàn)模型在夜間過度關(guān)注路燈而非行人。 ? 實時性保障: ?時間感知測試框架(TAF)注入時間戳探針,監(jiān)控函數(shù)執(zhí)行耗時。例如,某路徑規(guī)劃算法因內(nèi)存泄漏導致響應
    發(fā)表于 05-12 15:59

    自動駕駛安全程度達到99%是否就足夠了?

    [首發(fā)于智駕最前沿微信公眾號]五一假期,閑來無事,想到一個問題,現(xiàn)在監(jiān)管部門對于自動駕駛的要求已經(jīng)非常嚴苛,那自動駕駛要達到什么程度才算足夠安全?如果達到99%,是否就可以商用了?抑或自動駕駛
    的頭像 發(fā)表于 05-03 08:42 ?534次閱讀

    模型如何推動自動駕駛技術(shù)革新?

    [首發(fā)于智駕最前沿微信公眾號]近年來,人工智能技術(shù)正以前所未有的速度在各個領(lǐng)域滲透與應用,而大模型(大語言模型和多模態(tài)大模型)的迅猛發(fā)展為自動駕駛
    的頭像 發(fā)表于 04-20 13:16 ?661次閱讀
    大<b class='flag-5'>模型</b>如何推動<b class='flag-5'>自動駕駛</b>技術(shù)革新?

    自動駕駛模型中常提的Token是個啥?對自動駕駛有何影響?

    近年來,人工智能技術(shù)迅速發(fā)展,大規(guī)模深度學習模型(即大模型)在自然語言處理、計算機視覺、語音識別以及自動駕駛等多個領(lǐng)域取得了突破性進展。自動駕駛
    的頭像 發(fā)表于 03-28 09:16 ?939次閱讀

    NVIDIA Halos自動駕駛汽車安全系統(tǒng)發(fā)布

    NVIDIA 整合了從云端到車端的安全自動駕駛開發(fā)技術(shù)套件,涵蓋車輛架構(gòu)到 AI 模型,包括芯片、軟件、工具和服務。 物理 AI 正在為自動駕駛和機器人開發(fā)技術(shù)的交叉領(lǐng)域釋放新的可能性,尤其是加速了
    的頭像 發(fā)表于 03-25 14:51 ?947次閱讀