chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動(dòng)駕駛中Transformer大模型會(huì)取代深度學(xué)習(xí)嗎?

智駕最前沿 ? 來(lái)源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-08-13 09:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]近年來(lái),隨著ChatGPT、Claude、文心一言等大語(yǔ)言模型在生成文本、對(duì)話交互等領(lǐng)域的驚艷表現(xiàn),“Transformer架構(gòu)是否正在取代傳統(tǒng)深度學(xué)習(xí)”這一話題一直被持續(xù)討論。特別是在自動(dòng)駕駛領(lǐng)域,部分廠商開(kāi)始嘗試將多模態(tài)大模型(MLLM)引入到感知、規(guī)劃與決策系統(tǒng),引發(fā)了“傳統(tǒng)深度學(xué)習(xí)是否已過(guò)時(shí)”的激烈爭(zhēng)論。然而,從技術(shù)原理、算力成本、安全需求與實(shí)際落地路徑等維度來(lái)看,Transformer與深度學(xué)習(xí)并非你死我活的替代關(guān)系,更像是相互協(xié)作的搭檔,各自承擔(dān)著不同但關(guān)鍵的系統(tǒng)職責(zé)。

在自動(dòng)駕駛的系統(tǒng)架構(gòu)中,感知、預(yù)測(cè)、決策和控制構(gòu)成了整套智能系統(tǒng)的核心流程。感知主要依賴傳感器獲取包括車輛、行人、車道、紅綠燈等外界信息,而后續(xù)的模塊將這些信息輸入到路徑預(yù)測(cè)、行為推理、避障規(guī)劃等過(guò)程中,最終通過(guò)控制模塊發(fā)出操作指令。傳統(tǒng)的深度學(xué)習(xí)技術(shù),尤其是卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)以及長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM),在這些任務(wù)中長(zhǎng)期占據(jù)主導(dǎo)地位。它們擅長(zhǎng)從大規(guī)模標(biāo)注數(shù)據(jù)中學(xué)習(xí)復(fù)雜模式,尤其在圖像識(shí)別和語(yǔ)義分割任務(wù)中表現(xiàn)極其穩(wěn)定。這些能力對(duì)于自動(dòng)駕駛感知模塊來(lái)說(shuō)至關(guān)重要,因?yàn)檐囕v必須在毫秒級(jí)時(shí)間內(nèi)精確識(shí)別交通元素,做出正確判斷。

那么,Transformer及其演化版本——大語(yǔ)言模型(LLMs)是如何進(jìn)入自動(dòng)駕駛語(yǔ)境的?最早,這類模型在自然語(yǔ)言處理(NLP)中大放異彩,其核心能力是利用“注意力機(jī)制”捕捉序列中各個(gè)元素之間的全局關(guān)系,從而建立強(qiáng)大的上下文理解能力。當(dāng)這種能力擴(kuò)展到圖像、視頻、雷達(dá)點(diǎn)云等非語(yǔ)言模態(tài)時(shí),便演化出了多模態(tài)大模型。這些模型開(kāi)始被用于分析交通情境、預(yù)測(cè)行為意圖甚至制定高層級(jí)的駕駛策略。如當(dāng)系統(tǒng)識(shí)別到一名行人正在接近斑馬線時(shí),LLM可以結(jié)合先前的上下文,推理出行人可能即將穿越道路,從而提示系統(tǒng)減速或者繞行。

盡管LLM擁有非常強(qiáng)的表現(xiàn),但想讓LLM完全替代傳統(tǒng)深度學(xué)習(xí)仍存在很多障礙。其一,感知模塊需要實(shí)時(shí)響應(yīng),對(duì)延遲極為敏感,而當(dāng)前的LLM通常體積龐大,推理延遲高,難以滿足車載算力環(huán)境下的效率需求。其二,LLM存在“幻覺(jué)”問(wèn)題,即在缺乏明確指令或訓(xùn)練邊界時(shí)可能生成虛假或無(wú)效內(nèi)容。這在文本生成中也許只是語(yǔ)義錯(cuò)誤,但在自動(dòng)駕駛中則可能導(dǎo)致不可控的安全風(fēng)險(xiǎn)。其三,Transformer架構(gòu)天生是“黑盒”模型,其推理過(guò)程難以解釋,這與自動(dòng)駕駛系統(tǒng)對(duì)安全審計(jì)、責(zé)任劃分和法規(guī)合規(guī)的高度可解釋性要求存在本質(zhì)沖突。

當(dāng)前一些技術(shù)方案正在嘗試“融合式架構(gòu)”,即不再二選一,而是將Transformer與深度學(xué)習(xí)各自用于最適合的模塊中。如感知系統(tǒng)繼續(xù)由CNN主導(dǎo),以保證高效率和高準(zhǔn)確性,而行為預(yù)測(cè)、意圖理解等推理性任務(wù)則由LLM輔助,提供更加豐富的語(yǔ)義支撐。甚至出現(xiàn)了一些具有“世界模型”能力的Transformer,可以通過(guò)對(duì)復(fù)雜交通環(huán)境的抽象建模,實(shí)現(xiàn)自我模擬、自我優(yōu)化。如小馬智行和Waymo等企業(yè)就采用了生成式AI與強(qiáng)化學(xué)習(xí)相結(jié)合的路徑,用于訓(xùn)練自動(dòng)駕駛系統(tǒng)在“長(zhǎng)尾場(chǎng)景”中的魯棒性。

wKgZPGib50-AEv3KAABtyQxab3s872.jpg

小馬智行解決方案

所謂“長(zhǎng)尾場(chǎng)景”,是指那些在現(xiàn)實(shí)中極其罕見(jiàn)但又可能導(dǎo)致嚴(yán)重事故的交通情形,比如高速公路上掉落的鐵桶,或電動(dòng)車突然逆行。這類場(chǎng)景在真實(shí)數(shù)據(jù)集中幾乎不可能窮盡采集,因此生成式AI成為補(bǔ)充訓(xùn)練數(shù)據(jù)的有效手段。Transformer在此處可以發(fā)揮作用,通過(guò)構(gòu)建基礎(chǔ)世界模型,模擬出這些罕見(jiàn)事件,從而提升系統(tǒng)的泛化能力。這種方式與AlphaGo早期學(xué)習(xí)人類棋譜的模仿學(xué)習(xí)相比,更類似于AlphaZero的自我博弈訓(xùn)練邏輯,即通過(guò)模擬世界不斷優(yōu)化自身策略。

模擬能力的提升也不意味著真實(shí)感知能力可以被忽略。真實(shí)環(huán)境下的道路情況千變?nèi)f化,光線、天氣、交通設(shè)施甚至人類行為都有不可預(yù)測(cè)的變量。只有深度學(xué)習(xí)算法對(duì)真實(shí)傳感器數(shù)據(jù)的穩(wěn)定識(shí)別能力,才能確保系統(tǒng)在最底層建立可靠輸入。Transformer只能在此基礎(chǔ)上做進(jìn)一步“思考”,卻不能完全“接管”任務(wù)流程。

還有一個(gè)不能忽視的問(wèn)題是資源成本。LLMs往往依賴如GPU、TPU或?qū)S蒙窠?jīng)網(wǎng)絡(luò)加速芯片等高性能算力平臺(tái),其部署成本極高。尤其在邊緣計(jì)算為主的自動(dòng)駕駛車輛中,車載芯片資源有限,無(wú)法支持大規(guī)模參數(shù)模型的常態(tài)運(yùn)行。相比之下,傳統(tǒng)深度學(xué)習(xí)模型經(jīng)過(guò)多年優(yōu)化,早已形成標(biāo)準(zhǔn)化的輕量級(jí)版本,能夠在嵌入式平臺(tái)上高效運(yùn)行。因此,目前主流廠商多數(shù)仍在感知和控制層面采用深度學(xué)習(xí)方案,而將Transformer用于云端或訓(xùn)練環(huán)節(jié),作為仿真生成、行為推理等場(chǎng)景的工具。

在路徑規(guī)劃環(huán)節(jié),Transformer也遇到實(shí)際挑戰(zhàn)。路徑規(guī)劃是一項(xiàng)要求高度實(shí)時(shí)性和高可靠性的任務(wù),每一次決策都必須在極短時(shí)間內(nèi)完成,并具備高度確定性。大模型雖然在策略生成和規(guī)則制定上具備潛力,但在執(zhí)行效率和可控性方面仍難與傳統(tǒng)A*、RRT、BEV-basedlearning等路徑規(guī)劃算法媲美。此外,大模型輸出的隨機(jī)性與路徑規(guī)劃任務(wù)的確定性形成天然沖突,一旦規(guī)劃路徑不確定或出現(xiàn)偏差,將嚴(yán)重影響行車安全。

從系統(tǒng)架構(gòu)的演進(jìn)趨勢(shì)來(lái)看,自動(dòng)駕駛行業(yè)正逐步走向“多模態(tài)+分工協(xié)作”模式。感知、控制、導(dǎo)航等模塊保持使用穩(wěn)定可靠的深度學(xué)習(xí)體系,而認(rèn)知層、交互層則可逐步引入LLMs,提升整車系統(tǒng)的理解力和推理能力。如自動(dòng)駕駛車輛在接近施工區(qū)域時(shí),傳統(tǒng)模型只能識(shí)別出前方有障礙物,而LLMs能夠通過(guò)“語(yǔ)義理解”判斷出這些障礙可能是臨時(shí)的,進(jìn)而優(yōu)化繞行路徑。未來(lái)還可探索將自然語(yǔ)言與車輛交互融合,如讓乘客以語(yǔ)音方式發(fā)出“去最近的加油站”或“我想避開(kāi)高速”之類指令,由大模型解析后生成交通行為策略。

但這些探索尚處于試驗(yàn)與驗(yàn)證階段。監(jiān)管機(jī)構(gòu)對(duì)自動(dòng)駕駛系統(tǒng)的“黑盒性”極為謹(jǐn)慎。Transformer模型在文本生成中出現(xiàn)的不穩(wěn)定性一旦遷移至交通系統(tǒng),可能導(dǎo)致災(zāi)難性后果。因此,目前的大模型更可能作為“增強(qiáng)模塊”參與系統(tǒng)設(shè)計(jì),而非完全替代深度學(xué)習(xí)基礎(chǔ)架構(gòu)。

從整個(gè)行業(yè)來(lái)看,判斷Transformer是否取代深度學(xué)習(xí),關(guān)鍵不在于技術(shù)路線之爭(zhēng),而在于適用性與安全性。在大語(yǔ)言模型快速發(fā)展的背景下,我們應(yīng)當(dāng)看到其在認(rèn)知理解、行為建模與復(fù)雜推理上的巨大潛力,但也必須正視其高算力需求、不確定性輸出和缺乏可解釋性的現(xiàn)實(shí)挑戰(zhàn)。在自動(dòng)駕駛這樣的“物理AI”場(chǎng)景中,任何一個(gè)系統(tǒng)模塊的失誤都可能帶來(lái)生命安全風(fēng)險(xiǎn),因此技術(shù)的引入必須謹(jǐn)慎。

簡(jiǎn)而言之,Transformer與深度學(xué)習(xí)之間并非此消彼長(zhǎng)的替代關(guān)系,而是互補(bǔ)與融合的發(fā)展格局。它們?cè)诓煌瑢蛹?jí)承擔(dān)各自最擅長(zhǎng)的任務(wù),共同構(gòu)建更加智能、安全與高效的自動(dòng)駕駛系統(tǒng)。未來(lái),隨著技術(shù)演進(jìn)與芯片平臺(tái)優(yōu)化,或許會(huì)出現(xiàn)更加輕量化、可解釋且穩(wěn)定的Transformer模型,從而進(jìn)一步拓寬其在自動(dòng)駕駛系統(tǒng)中的角色,但在此之前,深度學(xué)習(xí)仍將在底層穩(wěn)定運(yùn)行,筑牢智能出行的安全基礎(chǔ)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    791

    文章

    14543

    瀏覽量

    173933
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5586

    瀏覽量

    123646
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3351

    瀏覽量

    4723
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動(dòng)駕駛真的會(huì)來(lái)嗎?

    所需要的圖像識(shí)別、計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)等關(guān)鍵技術(shù)的投資熱度在明顯增強(qiáng)。另外,也已經(jīng)有公司在開(kāi)發(fā)不同于普通地圖的3D地圖,能詳細(xì)到道路旁邊的電線桿的位置,以及與下一個(gè)油桶、燈柱距離。對(duì)于自動(dòng)駕駛的發(fā)展
    發(fā)表于 07-21 09:00

    細(xì)說(shuō)關(guān)于自動(dòng)駕駛那些事兒

    輔助系統(tǒng)系統(tǒng))用到的技術(shù)重迭。自駕車如何看見(jiàn)世界為什么要這么多種傳感器??jī)?yōu)缺點(diǎn)互補(bǔ)目前多數(shù)車商在量產(chǎn)車配備的“自動(dòng)駕駛”功能,包含特斯拉、Volvo、Mercedes-Benz、奧迪等,事實(shí)上就是搭載
    發(fā)表于 05-15 17:49

    自動(dòng)駕駛的到來(lái)

    的Telematics收發(fā)芯片,非常適合V2V及V2X等相關(guān)應(yīng)用?! ∠啾扔趥鹘y(tǒng)的底盤、發(fā)動(dòng)機(jī)等傳統(tǒng)汽車技術(shù),自動(dòng)駕駛更多的技術(shù)集中在電子領(lǐng)域,而且核心技術(shù)并沒(méi)有被跨國(guó)車廠或Tier1所壟斷。并且
    發(fā)表于 06-08 15:25

    AI/自動(dòng)駕駛領(lǐng)域的巔峰會(huì)議—國(guó)際AI自動(dòng)駕駛高峰論壇

    已經(jīng)滲透到了社會(huì)生活的方方面面。人工智能在自動(dòng)駕駛領(lǐng)域?qū)?duì)整個(gè)汽車出行領(lǐng)域產(chǎn)生顛覆性變革。汽車的人工智能技術(shù)和數(shù)據(jù)后端的最新突破使自動(dòng)駕駛成為可能。深度學(xué)習(xí)、高級(jí)數(shù)字助理和動(dòng)態(tài)電子視野
    發(fā)表于 09-13 13:59

    如何讓自動(dòng)駕駛更加安全?

    自動(dòng)駕駛、完全自動(dòng)駕駛。第四級(jí)別是汽車駕駛自動(dòng)化、智能化程度最高級(jí)別,也就是通常所說(shuō)的無(wú)人駕駛?,F(xiàn)實(shí)
    發(fā)表于 05-13 00:26

    如何保證自動(dòng)駕駛的安全?

    自動(dòng)駕駛技術(shù)為人們勾勒出了一副美好的未來(lái)出行的畫(huà)面:坐上沒(méi)有方向盤的汽車,一覺(jué)睡到公司門口;甚至我們可能不再擁有一輛汽車,需要出門時(shí)共享自動(dòng)駕駛汽車會(huì)自己到來(lái),送到目的地時(shí)會(huì)自行離開(kāi)……不過(guò)
    發(fā)表于 10-22 07:45

    自動(dòng)駕駛車輛AI面臨的挑戰(zhàn)

    自動(dòng)駕駛車輛采用的AI算法自動(dòng)駕駛車輛AI面臨的挑戰(zhàn)
    發(fā)表于 02-22 06:39

    探討深度學(xué)習(xí)自動(dòng)駕駛的應(yīng)用

    深度強(qiáng)化學(xué)習(xí)的理論、自動(dòng)駕駛技術(shù)的現(xiàn)狀以及問(wèn)題、深度強(qiáng)化學(xué)習(xí)自動(dòng)駕駛技術(shù)當(dāng)中的應(yīng)用及基于
    的頭像 發(fā)表于 08-18 10:19 ?5652次閱讀

    如何基于深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)一個(gè)端到端的自動(dòng)駕駛模型

    如何基于深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)一個(gè)端到端的自動(dòng)駕駛模型?如何設(shè)計(jì)一個(gè)基于增強(qiáng)學(xué)習(xí)自動(dòng)駕駛決策系統(tǒng)?
    的頭像 發(fā)表于 04-29 16:44 ?5543次閱讀
    如何基于<b class='flag-5'>深度</b>神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)一個(gè)端到端的<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>模型</b>?

    深度學(xué)習(xí)技術(shù)與自動(dòng)駕駛設(shè)計(jì)的結(jié)合

    在過(guò)去的十年里,自動(dòng)駕駛汽車技術(shù)取得了越來(lái)越快的進(jìn)步,主要得益于深度學(xué)習(xí)和人工智能領(lǐng)域的進(jìn)步。作者就自動(dòng)駕駛中使用的深度
    發(fā)表于 10-28 16:07 ?2319次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>技術(shù)與<b class='flag-5'>自動(dòng)駕駛</b>設(shè)計(jì)的結(jié)合

    深度學(xué)習(xí)算法在自動(dòng)駕駛規(guī)控的應(yīng)用解讀

    雖然目前公開(kāi)的自動(dòng)駕駛規(guī)控算法相關(guān)資料大都是針對(duì)基于規(guī)則的算法的,但筆者打開(kāi)招聘軟件卻經(jīng)常能看到自動(dòng)駕駛企業(yè)招聘規(guī)控算法工程師時(shí)會(huì)要求候選人懂深度學(xué)習(xí)算法,這在某種程度上也說(shuō)明了目前很
    的頭像 發(fā)表于 11-16 09:57 ?1828次閱讀

    自動(dòng)駕駛的機(jī)器學(xué)習(xí)

    近年來(lái),自動(dòng)駕駛技術(shù)技術(shù)的發(fā)展速度非常快。預(yù)計(jì)達(dá)到完全自動(dòng)駕駛L5的程度是指日可待的。自動(dòng)駕駛的核心技術(shù)主要是人工智能的機(jī)器學(xué)習(xí)與深 度
    發(fā)表于 06-06 10:06 ?0次下載
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中</b>的機(jī)器<b class='flag-5'>學(xué)習(xí)</b>

    深度學(xué)習(xí)自動(dòng)駕駛的關(guān)鍵技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,自動(dòng)駕駛技術(shù)作為其中的重要分支,正逐漸走向成熟。在自動(dòng)駕駛系統(tǒng),深度學(xué)習(xí)技術(shù)發(fā)揮著至關(guān)重要的作用。它通過(guò)模擬人
    的頭像 發(fā)表于 07-01 11:40 ?1533次閱讀

    自動(dòng)駕駛中一直說(shuō)的BEV+Transformer到底是個(gè)啥?

    在很多車企的自動(dòng)駕駛介紹,都會(huì)聽(tīng)到一個(gè)關(guān)鍵技術(shù),那就是BEV+Transformer,那BEV+Transformer到底是個(gè)啥?為什么很多車企在
    的頭像 發(fā)表于 11-07 11:19 ?1866次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中一直說(shuō)的BEV+<b class='flag-5'>Transformer</b>到底是個(gè)啥?

    自動(dòng)駕駛模型中常提的Token是個(gè)啥?對(duì)自動(dòng)駕駛有何影響?

    近年來(lái),人工智能技術(shù)迅速發(fā)展,大規(guī)模深度學(xué)習(xí)模型(即大模型)在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別以及自動(dòng)駕駛等多個(gè)領(lǐng)域取得了突破性進(jìn)展。
    的頭像 發(fā)表于 03-28 09:16 ?670次閱讀