chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能駕駛真的需要語(yǔ)言模型嗎?

智駕最前沿 ? 來(lái)源:智駕最前沿 ? 作者:智駕最前沿 ? 2026-03-11 09:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]就在前一段時(shí)間,某品牌車語(yǔ)音控制燈光失誤的視頻在網(wǎng)上瘋傳,在深夜的高速公路上,車主只是隨口說(shuō)了一句“關(guān)閉所有閱讀燈”,想要調(diào)暗車內(nèi)光線。然而,車載語(yǔ)音系統(tǒng)卻出現(xiàn)了一次致命的誤判,它不僅關(guān)掉了車內(nèi)的閱讀燈,連帶著車頭最關(guān)鍵的大燈也一并熄滅。駕駛員在驚恐中連聲呼喊“打開(kāi)燈光”,但伴隨著車輛撞上護(hù)欄撞擊聲外,只傳來(lái)語(yǔ)音助手那溫柔卻又無(wú)比機(jī)械的回復(fù):“暫時(shí)還不會(huì)喲”。

這起事故之所以引發(fā)全網(wǎng)熱議,除了發(fā)生事故外,更多是因?yàn)樗珳?zhǔn)地?fù)糁辛巳藗儗?duì)“軟件定義汽車”時(shí)代的某種擔(dān)憂。當(dāng)車內(nèi)的物理按鍵消失,當(dāng)燈光、空調(diào)甚至擋位都交給一串代碼和那個(gè)看起來(lái)聰明的語(yǔ)音助手時(shí),我們真的更安全了嗎?語(yǔ)言模型對(duì)于自動(dòng)駕駛和智能座艙來(lái)說(shuō),到底是必不可少?還是一個(gè)華麗裝飾?

wKgZPGmwweqAQ9W2AAAQo00DEvw513.jpg

為語(yǔ)音助手有時(shí)會(huì)顯得有點(diǎn)“聾”?

為什么在家里能聽(tīng)懂你講冷笑話的AI,到了高速公路上有時(shí)就成了“半個(gè)聾子”。車內(nèi)其實(shí)是一個(gè)雜音非常多的環(huán)境。當(dāng)車速達(dá)到一百公里每小時(shí),輪胎摩擦地面的胎噪、劃破空氣的風(fēng)噪,以及發(fā)動(dòng)機(jī)或電機(jī)的高頻振動(dòng)會(huì)混合成一種巨大的背景噪音。

對(duì)于人類耳朵來(lái)說(shuō),我們有一套極其精密的濾波機(jī)制,能自動(dòng)把同伴的說(shuō)話聲從噪音中拎出來(lái)。但對(duì)車載麥克風(fēng)來(lái)說(shuō),它接收到的是一個(gè)混雜了各種波形的信號(hào)。

在這次的事故視頻中,車主發(fā)出的指令是“關(guān)閉所有閱讀燈”。從普通話的發(fā)音和語(yǔ)義向量來(lái)看,“閱讀燈”和“全車燈光”在某些解析算法里可能非常接近。特別是在高速行駛的背景噪音下,聲音的特征碼會(huì)發(fā)生扭曲。

wKgZO2mwweqAU86yAAxhRWxI_H8757.jpg

圖片源自:網(wǎng)絡(luò)

語(yǔ)音識(shí)別系統(tǒng)(ASR)可能在第一步就把“閱讀”這兩個(gè)字的特征給弄丟了,只剩下一個(gè)“燈”字和“關(guān)閉”的動(dòng)作。接著,自然語(yǔ)言理解(NLU)模塊就會(huì)根據(jù)概率去猜,最后它猜出了一個(gè)權(quán)重最高的動(dòng)作,即關(guān)閉所有燈光。

其實(shí)在整個(gè)視頻中,最后一句“暫時(shí)還不會(huì)喲”的回復(fù)最耐人尋味。這其實(shí)反映出了當(dāng)前車載語(yǔ)音系統(tǒng)的另一個(gè)技術(shù)軟肋,在極端壓力下的識(shí)別能力。當(dāng)燈光熄滅、生死攸關(guān)時(shí),車主會(huì)產(chǎn)生劇烈的生理反應(yīng),呼吸急促、音調(diào)升高、語(yǔ)速極快。

傳統(tǒng)的語(yǔ)音模型是基于平穩(wěn)、冷靜的語(yǔ)音庫(kù)訓(xùn)練出來(lái)的,它們面對(duì)這種充滿了恐慌情緒的“求救信號(hào)”,會(huì)因?yàn)橹眯哦忍投|發(fā)預(yù)設(shè)的兜底回復(fù)。這種預(yù)設(shè)回復(fù)本是為了顯得有親和力,但在那個(gè)瞬間,它卻顯得有些不合時(shí)宜。

說(shuō)到底,目前的語(yǔ)音助手還是一個(gè)坐在副駕上的“翻譯官”,它只是在翻譯指令,而沒(méi)有真正理解這些指令對(duì)于一個(gè)正在高速移動(dòng)的車輛意味著什么。

場(chǎng)景 背景噪音水平 語(yǔ)言特征 容錯(cuò)處理要求 核心挑戰(zhàn)
居家辦公 較低(30~40dB) 語(yǔ)速平緩,日產(chǎn)詞匯 較低,可重復(fù)輸入 遠(yuǎn)場(chǎng)拾音與回聲消除
喧鬧商場(chǎng) 中高(60~70dB) 碎片化、方言多 中等,會(huì)有提示 雜亂的人聲干擾
高速行駛 極高(70~85dB) 壓力狀態(tài)下語(yǔ)速極快 極高,涉及行車安全 寬頻噪音掩蓋,情緒特征畸變

wKgZPGmwweuAM3t8AAAR42n7O-I951.jpg

域隔離的崩塌與消失的保命按鍵

很多人不理解,既然語(yǔ)音助手可能聽(tīng)錯(cuò),那為什么它能有權(quán)限直接關(guān)掉行駛中的大燈?這其實(shí)涉及到了一個(gè)汽車電子架構(gòu)的專業(yè)概念,域隔離。一輛汽車的電子系統(tǒng)通常被劃分為不同的“域”,比如負(fù)責(zé)娛樂(lè)、導(dǎo)航、語(yǔ)音的座艙域;負(fù)責(zé)燈光、雨刷、車窗的車身域以及負(fù)責(zé)動(dòng)力和制動(dòng)的底盤(pán)域。

按照安全邏輯,座艙域應(yīng)該只是一個(gè)多話的導(dǎo)游,它不應(yīng)該有權(quán)直接插手駕駛員的“方向盤(pán)”和“外燈光”。

然而,為了追求所謂的“全智能交互”,讓車主動(dòng)動(dòng)嘴就能控制車內(nèi)的一切,廠家會(huì)在座艙域和車身域之間開(kāi)辟一條通信快速通道。這次事故其實(shí)就暴露出這條通道在權(quán)限管理上存在巨大的安全風(fēng)險(xiǎn)。

原本屬于高安全等級(jí)的大燈控制權(quán),被過(guò)于隨意地交給了低安全等級(jí)的語(yǔ)音識(shí)別模塊。在汽車功能安全標(biāo)準(zhǔn)ISO 26262中,這屬于嚴(yán)重的邏輯缺陷。在車輛處于高速行駛狀態(tài)下,系統(tǒng)不僅沒(méi)有對(duì)“關(guān)閉大燈”這種危險(xiǎn)指令設(shè)置二次確認(rèn),甚至沒(méi)有對(duì)車速、環(huán)境光線和大燈狀態(tài)進(jìn)行聯(lián)合校驗(yàn)。

這種“極簡(jiǎn)主義”的代價(jià)是沉重的。隨著物理按鍵的消失,駕駛員在失去視覺(jué)引導(dǎo)時(shí),無(wú)法再依靠肌肉記憶通過(guò)撥桿打開(kāi)燈光。事故后,該車企緊急推送了OTA更新,將行駛狀態(tài)下的大燈關(guān)閉權(quán)限修改為“僅支持手動(dòng)控制”。

wKgZO2mwweuALLZsAABM1W8S1_Y619.jpg

圖片源自:微博

這其實(shí)是一種權(quán)力的收回。它說(shuō)明在現(xiàn)有的技術(shù)條件下,非確定性的語(yǔ)音交互不應(yīng)擁有管理安全核心件的最高權(quán)限。那些被網(wǎng)友稱為“保命按鍵”的物理?yè)軛U,提供的是一種超越軟件算法的物理確定性。在生死瞬間,確定性比所謂的智能更重要。

wKgZPGmwwe2AYSo_AAASG3BOmsQ614.jpg

語(yǔ)言模型是自動(dòng)駕駛的解藥還是毒藥

既然傳統(tǒng)的語(yǔ)音系統(tǒng)容易聽(tīng)錯(cuò),那最近大熱的大語(yǔ)言模型(LLM)能解決這個(gè)問(wèn)題嗎?在自動(dòng)駕駛領(lǐng)域,專家們經(jīng)常提到“系統(tǒng)1”和“系統(tǒng)2”。系統(tǒng)1是直覺(jué)性的、快速的,就像我們開(kāi)車時(shí)的肌肉記憶,看到紅燈就剎車;系統(tǒng)2是理性的、慢速的,用來(lái)處理復(fù)雜的博弈和意料之外的狀況。

目前的自動(dòng)駕駛和語(yǔ)音助手大多還在系統(tǒng)1的水平。它們是在死板地匹配關(guān)鍵詞。如果你說(shuō)“關(guān)掉閱讀燈”,它就去匹配那幾個(gè)字,一旦聽(tīng)錯(cuò)就全盤(pán)皆錯(cuò)。而大模型的意義在于它為汽車裝上了一個(gè)具有常識(shí)推理能力的“系統(tǒng)2”。如果是搭載了大模型的系統(tǒng),在聽(tīng)到“關(guān)閉所有燈光”時(shí),它的第一反應(yīng)不是去執(zhí)行,而是進(jìn)行邏輯自檢。

wKgZO2mwwe6AJJ90ANjglQ9o894469.jpg

圖片源自:網(wǎng)絡(luò)

它會(huì)調(diào)動(dòng)視覺(jué)傳感器發(fā)現(xiàn)現(xiàn)在是深夜,GPS會(huì)告訴它正在高速上,它的常識(shí)庫(kù)會(huì)提示它,在深夜的高速上關(guān)掉大燈是自殺行為。于是,它會(huì)拒絕執(zhí)行這個(gè)離譜的指令,或者用更有邏輯的方式向車主確認(rèn)。

這種能力被稱為“多模態(tài)理解”。未來(lái)的語(yǔ)言模型不再僅僅是處理文字,它會(huì)將視覺(jué)(攝像頭看到的黑夜)、動(dòng)作(正在高速行駛的速度)和語(yǔ)義(車主的要求)結(jié)合在一起。這就是大家熟知的VLA(視覺(jué)-語(yǔ)言-動(dòng)作)模型。

但大模型也并非完美。它最大的問(wèn)題在于“幻覺(jué)”。大模型本質(zhì)上是一個(gè)概率預(yù)測(cè)器,它吐出的每一個(gè)指令都是基于統(tǒng)計(jì)的最大可能性,而不是邏輯上的絕對(duì)必然。

對(duì)于駕駛來(lái)說(shuō),哪怕只有萬(wàn)分之一的概率出現(xiàn)幻覺(jué),都是不可接受的。所以,大模型在車上的應(yīng)用,目前更多是作為一個(gè)“大腦”去思考,而真正的“手腳”控制依然需要嚴(yán)密的硬性代碼邏輯來(lái)把關(guān)。

wKgZO2mwwfKAE0LjAAASAJELks8203.jpg

如何在軟件定義的未來(lái)里守住安全的底線

要確保語(yǔ)音識(shí)別的準(zhǔn)確性和安全性,我們不能只指望AI變得更聰明,還要在系統(tǒng)架構(gòu)上做加法。硬件層面的冗余是非常有必要的,比如通過(guò)多麥克風(fēng)陣列的波束成形技術(shù),像探照燈一樣定向采集駕駛員的聲音,以此來(lái)抵消外界的寬頻噪音。同時(shí),核心指令的解析必須具備“離線處理”能力,不能因?yàn)樗淼览餂](méi)信號(hào),就無(wú)法應(yīng)答和處理。

更核心的改進(jìn)應(yīng)該是語(yǔ)義校驗(yàn)機(jī)制的引入。一個(gè)合格的智能座艙,不應(yīng)該只是聽(tīng)話的助手,而應(yīng)該是有安全底線的管家。系統(tǒng)需要建立一套基于場(chǎng)景的“敏感指令庫(kù)”。在高速行駛、雨雪天氣或夜間等特定場(chǎng)景下,所有涉及車輛行駛安全的功能(如大燈、駐車制動(dòng)、車門開(kāi)啟等),語(yǔ)音助手的權(quán)限就應(yīng)該是被鎖定的,或者必須經(jīng)過(guò)物理確認(rèn)。

此外,我們還必須認(rèn)識(shí)到,智能化的目的應(yīng)該是減少人為失誤,而不是增加新的風(fēng)險(xiǎn)。當(dāng)車企在追求智能座艙的智能化時(shí),不能忘了汽車只是一種交通工具,其最底層的邏輯永遠(yuǎn)是安全。語(yǔ)言模型確實(shí)是未來(lái)自動(dòng)駕駛通往“擬人化”的橋梁,但在橋梁搭建好之前,物理?yè)軛U依然是科技給予我們的最后一份體面。

wKgZO2mwwfKAXEnbAAARwcz1hbg621.jpg

最后的話

科技進(jìn)步不應(yīng)該是一場(chǎng)博取流量的冒險(xiǎn)。正如許多老司機(jī)所言,最好的科技應(yīng)在平時(shí)讓你感覺(jué)不到它的存在,但在危急時(shí)刻能給你最確定的響應(yīng)。在追逐智能化的浪潮中,我們不能跑得太快。大模型很好,語(yǔ)音控制也很酷,但在那個(gè)能讓我們抓牢的物理?yè)軛U面前,它們暫時(shí)還只能算是助手,而不是主宰。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能駕駛
    +關(guān)注

    關(guān)注

    5

    文章

    3011

    瀏覽量

    51295
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    572

    瀏覽量

    11323
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何構(gòu)建適合自動(dòng)駕駛的世界模型?

    [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型經(jīng)歷了系統(tǒng)動(dòng)力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動(dòng)駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合自動(dòng)<b class='flag-5'>駕駛</b>的世界<b class='flag-5'>模型</b>?

    什么是大模型,智能體...?大模型100問(wèn),快速全面了解!

    一、概念篇1.什么是大模型?大模型是指參數(shù)規(guī)模巨大(通常達(dá)到數(shù)十億甚至萬(wàn)億級(jí)別)、使用海量數(shù)據(jù)訓(xùn)練而成的人工智能模型。2.什么是大語(yǔ)言
    的頭像 發(fā)表于 02-02 16:36 ?931次閱讀
    什么是大<b class='flag-5'>模型</b>,<b class='flag-5'>智能</b>體...?大<b class='flag-5'>模型</b>100問(wèn),快速全面了解!

    黑芝麻智能華山A2000 BaRT工具鏈助力輔助駕駛模型部署

    隨著智駕模型參數(shù)規(guī)模與計(jì)算復(fù)雜度指數(shù)級(jí)增長(zhǎng),大模型應(yīng)用與車端硬件、性能功耗的矛盾愈發(fā)凸顯,成為技術(shù)量產(chǎn)的關(guān)鍵瓶頸。在此背景下,黑芝麻智能華山A2000 BaRT 工具鏈以 MLIR 框架為基礎(chǔ),為輔助
    的頭像 發(fā)表于 02-02 15:37 ?341次閱讀
    黑芝麻<b class='flag-5'>智能</b>華山A2000 BaRT工具鏈助力輔助<b class='flag-5'>駕駛</b><b class='flag-5'>模型</b>部署

    基于NVIDIA Alpamayo構(gòu)建具備推理能力的輔助駕駛汽車

    輔助駕駛研究領(lǐng)域正經(jīng)歷一場(chǎng)快速變革。視覺(jué)-語(yǔ)言-動(dòng)作推理模型(Reasoning VLA) 的出現(xiàn)正重塑該領(lǐng)域,這些模型為輔助駕駛決策賦予了
    的頭像 發(fā)表于 01-14 09:41 ?2078次閱讀
    基于NVIDIA Alpamayo構(gòu)建具備推理能力的輔助<b class='flag-5'>駕駛</b>汽車

    VLA與世界模型有什么不同?

    [首發(fā)于智駕最前沿微信公眾號(hào)]當(dāng)前自動(dòng)駕駛行業(yè),各車企的技術(shù)路徑普遍選擇了單車智能方向。而在實(shí)際落地過(guò)程中,不同企業(yè)選擇了差異化的技術(shù)實(shí)現(xiàn)方式,部分車企側(cè)重于視覺(jué)—語(yǔ)言—?jiǎng)幼?b class='flag-5'>模型(Vi
    的頭像 發(fā)表于 12-17 09:13 ?645次閱讀
    VLA與世界<b class='flag-5'>模型</b>有什么不同?

    模型中常提的快慢思考會(huì)對(duì)自動(dòng)駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺(jué)語(yǔ)言模型和世界模型的全新自動(dòng)駕駛技術(shù)架構(gòu)標(biāo)志著其全棧自研的
    的頭像 發(fā)表于 11-22 10:59 ?2510次閱讀
    大<b class='flag-5'>模型</b>中常提的快慢思考會(huì)對(duì)自動(dòng)<b class='flag-5'>駕駛</b>產(chǎn)生什么影響?

    VLA和世界模型,誰(shuí)才是自動(dòng)駕駛的最優(yōu)解?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)發(fā)展,其實(shí)現(xiàn)路徑也呈現(xiàn)出兩種趨勢(shì),一邊是以理想、小鵬、小米為代表的VLA(視覺(jué)—語(yǔ)言—行動(dòng))模型路線;另一邊則是以華為、蔚來(lái)為主導(dǎo)的世界模型
    的頭像 發(fā)表于 11-05 08:55 ?794次閱讀
    VLA和世界<b class='flag-5'>模型</b>,誰(shuí)才是自動(dòng)<b class='flag-5'>駕駛</b>的最優(yōu)解?

    小白學(xué)大模型:從零實(shí)現(xiàn) LLM語(yǔ)言模型

    在當(dāng)今人工智能領(lǐng)域,大型語(yǔ)言模型(LLM)的開(kāi)發(fā)已經(jīng)成為一個(gè)熱門話題。這些模型通過(guò)學(xué)習(xí)大量的文本數(shù)據(jù),能夠生成自然語(yǔ)言文本,完成各種復(fù)雜的任
    的頭像 發(fā)表于 04-30 18:34 ?1321次閱讀
    小白學(xué)大<b class='flag-5'>模型</b>:從零實(shí)現(xiàn) LLM<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>

    AUDI攜手Momenta打造豪華智能輔助駕駛新范式

    近日,奧迪新品牌AUDI攜手全球領(lǐng)先的智能駕駛公司Momenta正式宣布,聯(lián)合打造行業(yè)首個(gè)“德系電動(dòng)豪華標(biāo)準(zhǔn)+飛輪大模型智能輔助駕駛方案,
    的頭像 發(fā)表于 04-27 10:17 ?859次閱讀

    如何借助大語(yǔ)言模型打造人工智能生態(tài)系統(tǒng)

    、硬件需求以及所涉及的財(cái)務(wù)影響這三者之間的內(nèi)在聯(lián)系。我們將深入探究現(xiàn)實(shí)中大語(yǔ)言模型的發(fā)展趨勢(shì),并共同探討如何借助規(guī)模更小、效能更高的模型,打造一個(gè)更具可持續(xù)性的人工智能生態(tài)系統(tǒng)。
    的頭像 發(fā)表于 04-27 09:19 ?1100次閱讀
    如何借助大<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>打造人工<b class='flag-5'>智能</b>生態(tài)系統(tǒng)

    模型如何推動(dòng)自動(dòng)駕駛技術(shù)革新?

    [首發(fā)于智駕最前沿微信公眾號(hào)]近年來(lái),人工智能技術(shù)正以前所未有的速度在各個(gè)領(lǐng)域滲透與應(yīng)用,而大模型(大語(yǔ)言模型和多模態(tài)大模型)的迅猛發(fā)展為自
    的頭像 發(fā)表于 04-20 13:16 ?1038次閱讀
    大<b class='flag-5'>模型</b>如何推動(dòng)自動(dòng)<b class='flag-5'>駕駛</b>技術(shù)革新?

    智能體仿真中的統(tǒng)一混合模型框架研究

    隨著GPT大語(yǔ)言模型的成功,越來(lái)越多的工作嘗試使用類GPT架構(gòu)的離散模型來(lái)表征駕駛場(chǎng)景中的交通參與者行為,從而生成多智能體仿真。這些方法展現(xiàn)
    的頭像 發(fā)表于 04-01 14:31 ?842次閱讀
    多<b class='flag-5'>智能</b>體仿真中的統(tǒng)一混合<b class='flag-5'>模型</b>框架研究

    新品 | Module LLM Kit,離線大語(yǔ)言模型推理模塊套裝

    推理與數(shù)據(jù)交互需求。ModuleLLM是一款集成化的離線大語(yǔ)言模型(LLM)推理模塊,專為需要高效、智能交互的終端設(shè)備設(shè)計(jì)。Module13.2LLMMate模塊
    的頭像 發(fā)表于 03-28 18:49 ?1225次閱讀
    新品 | Module LLM Kit,離線大<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>推理模塊套裝

    自動(dòng)駕駛模型中常提的Token是個(gè)啥?對(duì)自動(dòng)駕駛有何影響?

    近年來(lái),人工智能技術(shù)迅速發(fā)展,大規(guī)模深度學(xué)習(xí)模型(即大模型)在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別以及自動(dòng)駕駛等多個(gè)領(lǐng)域取得了突破性進(jìn)展。自動(dòng)
    的頭像 發(fā)表于 03-28 09:16 ?1359次閱讀

    ?VLM(視覺(jué)語(yǔ)言模型)?詳細(xì)解析

    視覺(jué)語(yǔ)言模型(Visual Language Model, VLM)是一種結(jié)合視覺(jué)(圖像/視頻)和語(yǔ)言(文本)處理能力的多模態(tài)人工智能模型
    的頭像 發(fā)表于 03-17 15:32 ?8913次閱讀
    ?VLM(視覺(jué)<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>)?詳細(xì)解析