chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

商湯絕影亮相汽車之家全球AI科技大會

商湯科技SenseTime ? 來源:商湯科技SenseTime ? 2025-09-29 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:絕影智能SenseAuto

近日,由汽車之家主辦的「汽車之家全球AI科技大會」在北京舉行。商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事、CTO、商湯絕影CEO王曉剛出席大會,并發(fā)表《世界模型:智能駕駛范式演進(jìn)新路標(biāo)》主題演講,分享了“絕影開悟”世界模型給智能駕駛帶來的技術(shù)變遷。

演講中他談到三個核心點:

第一,世界模型“生成式智駕”帶來智能駕駛3.0階段。智能駕駛從依賴人工標(biāo)注的“規(guī)則式智駕”1.0階段,發(fā)展到把人類行為積累轉(zhuǎn)化成為模型的“端到端智駕”2.0階段,最終正邁向通過世界模型和強(qiáng)化學(xué)習(xí)帶來超越人類的“生成式智駕”3.0階段。

第二,“絕影開悟”世界模型推動智能駕駛在三個方面取得突破。一是突破數(shù)據(jù)瓶頸,通過世界模型能夠生成無限長尾場景;二是有更加確定的技術(shù)安全邊界,通過仿真模擬物理世界,在仿真環(huán)境中不斷嘗試;三是通過自主進(jìn)化達(dá)到超越人類駕駛的體驗。

第三,“絕影開悟”世界模型實現(xiàn)全場景覆蓋,推動智能駕駛、具身智能跨越式發(fā)展。世界模型積累百萬級數(shù)據(jù)集,覆蓋各種復(fù)雜的場景,實現(xiàn)高保真、多視角時空一致性、4D實時互動。同時,世界模型在自動駕駛場景里開發(fā)出來的技術(shù)體系,也將賦能具身智能發(fā)展。

以下為主題演講內(nèi)容:

各位領(lǐng)導(dǎo)、各位同仁、各位嘉賓,大家下午好!

非常感謝汽車之家的邀請,來參加全球AI科技大會,也能夠有機(jī)會和大家分享世界模型——通用人工智能給自動駕駛帶來的技術(shù)的變遷。

世界模型“生成式智駕”帶來智能駕駛3.0階段

首先,我們認(rèn)為自動駕駛技術(shù)演進(jìn)的頻率是非??斓摹W詣玉{駛作為人工智能非常重要的組成部分,它的技術(shù)變遷也反映了人工智能發(fā)展的三個階段。大家比較熟悉的基于規(guī)則的智能駕駛,是自動駕駛的第一個階段。這一階段通過AI輸出感知的結(jié)果,建立各種規(guī)則,并預(yù)定義這些邏輯,再根據(jù)優(yōu)化物理模型實現(xiàn)規(guī)控?;谏鲜霈F(xiàn)象,我們在人工智能發(fā)展的每個階段會問這樣一個問題:智能到底是從哪里來?實際上,在第一個階段,很多的智能來自于人工。人類需要大量標(biāo)注各類感知數(shù)據(jù),然后得到它的輸出,并人工書寫各式各樣的規(guī)則。所以在上述階段有一句話:有多少人工就有多少的智能。而這個階段很像人工智能1.0發(fā)展的階段,例如我們會做很多人臉識別的視頻分析;我們會針對安防的場景,人工輸入智能的數(shù)據(jù)。

第二個階段是大模型的出現(xiàn),這是人工智能領(lǐng)域2.0,代表產(chǎn)品如ChatGPT。在互聯(lián)網(wǎng)上出現(xiàn)了過去很多年人類行為的數(shù)據(jù)積累,比如各種文章、代碼,這些都是人類行為智能的體現(xiàn)。在自動駕駛領(lǐng)域,對應(yīng)的是人類的駕駛行為,也就是第二階段行業(yè)內(nèi)推動的端到端自動駕駛。端到端自動駕駛把過去長時間人類行為積累的智能轉(zhuǎn)化成為模型的智能,這時候就出現(xiàn)了很大的智能和體驗上的躍遷。但是其自身也有瓶頸,那便是人類的行為就是智能的天花板,同時這種智能依賴大量高質(zhì)量數(shù)據(jù)。從自動駕駛發(fā)展來看,今天的大模型發(fā)展也遇到了上述瓶頸,因為我們在互聯(lián)網(wǎng)上積累起來的數(shù)據(jù)價值面臨枯竭境地。

因此,便進(jìn)入了第三個階段,通過世界模型,通過生成式智駕,通過強(qiáng)化學(xué)習(xí)做出進(jìn)一步的突破。舉一個非常典型的例子,2015年在圍棋領(lǐng)域出現(xiàn)了AIphaGo。之后又出現(xiàn)了AIphaZero,相較于AIphaGo,AIphaZero不需要任何人類知識的輸入,它也能夠產(chǎn)生大量的智能?,F(xiàn)如今在自動駕駛領(lǐng)域,大家都希望有一個世界模型,這個模型就像在圍棋里面,能夠創(chuàng)造棋盤和人類定義的圍棋規(guī)則,這便是更高階的智能。對照圍棋的例子,我們希望自動駕駛也能夠通過強(qiáng)化學(xué)習(xí)來突破人類行為上限。要達(dá)成這個目標(biāo),我們就需要一個世界模型。讓世界模型來模擬物理世界的規(guī)律、人類行為的法則和規(guī)律。在仿真的世界模型環(huán)境里面,機(jī)器通過強(qiáng)化學(xué)習(xí)做到不斷的提升,以及突破人類駕駛的上限。

我們可以看到今天在人工智能3.0的發(fā)展中,人們還提出了具身智能,這是從原來互聯(lián)網(wǎng)數(shù)據(jù)走出來,通過跟物理世界交互產(chǎn)生的新智能。在具身智能領(lǐng)域,世界模型也會扮演非常重要的角色。

“絕影開悟”世界模型推動智能駕駛在三個方面取得突破

回到端到端自動駕駛所面臨的問題,主要有三個方面。一是需要大量的數(shù)據(jù)。特斯拉擁有幾百萬臺車,而且這些車的傳感器配置是一致的,所以能夠回流大量的數(shù)據(jù)。而我們面臨的問題是沒有如此規(guī)模的數(shù)據(jù)。二是對于各種危險復(fù)雜的場景,尤其是Corner Case,這些場景獲得成本是非常高的,風(fēng)險也是非常高的。怎么獲得這些高質(zhì)量的數(shù)據(jù)是我們需要解決的問題。第三個是安全的邊界?,F(xiàn)在端到端自動駕駛中發(fā)現(xiàn)一個問題場景,我們就需要采集很多跟這個場景所類似的其他數(shù)據(jù),重新訓(xùn)練模型。但是模型訓(xùn)練完之后也不能夠確定這個場景是否真正被解決,因為端到端技術(shù)有不確定性在。

針對這些問題,我們要把世界模型、強(qiáng)化學(xué)習(xí),以及端到端技術(shù)相結(jié)合。在這里,核心是要有一個端到端的多模態(tài)大模型。這個模型的輸入可能是各種視覺的、激光的、語言文字導(dǎo)航的信息,輸出是車輛的行為。端到端大模型會預(yù)測車輛的軌跡,基于預(yù)測的軌跡反饋給世界模型,世界模型就能夠模擬仿真出物理世界將會怎樣的變化,給我們反饋基于世界模型合成的視頻,這些反饋將重新訓(xùn)練端到端模型。而且這個方法會告訴我們,什么樣的仿真模型是好的,如此循環(huán)往復(fù)的迭代,不斷提升端到端的性能。同時,在這個仿真環(huán)境里面可以無數(shù)次的試錯,有了問題場景以后,通過無數(shù)次的嘗試一定能夠解決我們所關(guān)心的問題,而且還能做到舉一反三、舉一反十、甚至反百。當(dāng)下的世界模型并不是無中生有,而是針對問題場景,我們通過復(fù)現(xiàn)物理場景,把現(xiàn)實里不能改變的各種要素,如天氣、道路、車速等,通過模擬仿真場景,比較徹底地解決類似問題。

接下來我給大家舉一個例子,看一看我們是怎么用世界模型和強(qiáng)化學(xué)習(xí)來解決問題的。這里展示的是一個問題場景。前方有一個施工占道場景出現(xiàn),我們需要急剎,大家想一想完成這個動作需要幾步?第一步需要做4D仿真的復(fù)現(xiàn),通過3DGS和靜態(tài)場景復(fù)現(xiàn),依托世界模型對它進(jìn)行修復(fù),就能夠得到更高質(zhì)量的4D空間。在4D空間里就可以嘗試各種不同駕駛的行為,調(diào)整端到端模型,嘗試各種不同的駕駛行為,直到在這個環(huán)境里找到最佳的駕駛行為。我們有一套完善的辦法去評價什么樣的駕駛行為是好的。

在上述單一場景里我們得到模型的更新和驗證后,接下來我們需要得到它進(jìn)一步的多個泛化場景?,F(xiàn)實世界中有很多類似的場景,比如說復(fù)雜的施工區(qū)域,需要換道通行,遇到圍欄需要減速等。這些不同的場景都是通過世界模型所生成出來的各類泛化場景。我們的模型在這些泛化場景里面做進(jìn)一步的學(xué)習(xí),以及進(jìn)行測試。

所以說現(xiàn)在的世界模型已經(jīng)可以推動自動駕駛在三個方面取得突破。一是數(shù)據(jù)瓶頸,可以通過世界模型產(chǎn)生無限長尾場景。二是能夠得到驗證的技術(shù)邊界,通過仿真模擬恢復(fù)物理的世界,在仿真環(huán)境不斷的嘗試。三是通過強(qiáng)化學(xué)習(xí)達(dá)到超越人類駕駛的體驗。

“絕影開悟”世界模型實現(xiàn)全場景覆蓋,推動智能駕駛、具身智能跨越式發(fā)展

要解決這些問題,背后核心是需要有個非常強(qiáng)大、質(zhì)量非常高的世界模型來重構(gòu)萬千世界,讓安全有更多的確定性。我們對世界模型會有哪些要求呢?一是生成的數(shù)據(jù)應(yīng)該是能夠面向量產(chǎn)的,能夠有更多的場景,而且能夠一鍵生成復(fù)雜可控的場景。二是場景里面有各種因素,可以針對各種因素進(jìn)行編輯,能夠把各種因素通過自由組合方式,實現(xiàn)更多的拓展。三是實時,在一定空間里面有非常高效的推理效率,促使在世界模型里面進(jìn)行實時互動。

這里我們給大家看一個例子。我們坐車?yán)镉龅紺ut-in這樣比較危險的場景。我們可以看到車?yán)镉?個攝像頭,每個攝像頭都在記錄。而要生成一個好的世界模型,就要保持多個攝像頭下的時空一致性。早在2024年,Sora模型就可以完成各種視頻的生成,現(xiàn)如今用世界模型做自動駕駛的話,它的難點在哪里?那便是生成有連續(xù)性的視頻比圖像更難。生成用在自動駕駛環(huán)境里視頻需要面臨很多困難,面對有眾多的攝像頭,模型要保持多個攝像頭的時空一致性。比如說面對車牌、道路的限行情況,各個攝像頭里的內(nèi)容應(yīng)該是一致的。另外,還有空間的幾何關(guān)系得是一致的,這樣生成的視頻才能夠有效的用作自動駕駛的訓(xùn)練和測試。

基于此,我們可以針對剛剛提到的打車Cut-in場景改變各種要素,比如換不同的天氣條件、不同的道路路形、插入的大車車型、車速和Cut-in的距離。有了這些之后,模型完全可以做到舉一反十、反一百、反一千。而且大家可以看到,這里一鍵生成了更加復(fù)雜的場景,例如車禍和碰撞的場景。

在這里我們還需要對場景里面的各種要素做到任意編輯,比如任意替換不同的車型、增加車輛、減少相應(yīng)的車輛,模擬不同的駕駛環(huán)境。

而且模型也需要能夠做到實時的推理,這里我們展示的是在上海市區(qū)場景,在這個場景里可以自由地開車、加減速、轉(zhuǎn)彎。大家所看到的這些視頻都與真實世界的物理環(huán)境非常接近。

世界模型產(chǎn)品化,開放API后,用戶可以描述他所想采用的數(shù)據(jù),然后一鍵生成形成各種各樣所期待的視頻。我們現(xiàn)在積累的百萬級數(shù)據(jù)集,覆蓋各種復(fù)雜的場景,能夠?qū)崿F(xiàn)高保真。現(xiàn)如今每一個Clips有150s,車輛有7個攝像頭就能保持比1080P更好的圖像質(zhì)量。

再說到基礎(chǔ)設(shè)施,現(xiàn)在各地政府也建立了實訓(xùn)場,能夠提供算力的平臺,真實采集實車的數(shù)據(jù)。另外,有一半的數(shù)據(jù)也是通過世界模型模擬仿真進(jìn)行生成,兩組數(shù)據(jù)相結(jié)合可以提供給車企進(jìn)行端到端模型的訓(xùn)練。

最后說下,在自動駕駛場景里使用的世界模型所開發(fā)出來的所有技術(shù)體系,其實也可以用到具身智能里。具身智能對世界模型的需求更加迫切。因為機(jī)器人的數(shù)量比車輛數(shù)量更少,而且每個機(jī)器人硬件的配置千差萬別。我們希望在具身智能領(lǐng)域里,世界模型能夠做到多模態(tài)、數(shù)據(jù)對齊,能夠得到4D空間,能夠進(jìn)行快速的推理。我給大家舉兩個例子,一是輸入一條指令讓機(jī)器人能夠在公園里進(jìn)行跳躍,就會自動地生成機(jī)器人的骨骼、姿態(tài)、動作的變化,基于這個能夠生成機(jī)器人第一視角看到視頻的數(shù)據(jù)和第三視角的數(shù)據(jù)。另外輸入指令讓機(jī)器臂切黃瓜,同樣可以生成第一和第三視角的數(shù)據(jù)。未來我們可以用這些大量的模擬仿真數(shù)據(jù),來推動自動駕駛和具身智能跨越到下一個階段。

謝謝大家!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    37958

    瀏覽量

    295720
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3640

    瀏覽量

    51678
  • 智能駕駛
    +關(guān)注

    關(guān)注

    5

    文章

    2941

    瀏覽量

    50936
  • 商湯
    +關(guān)注

    關(guān)注

    0

    文章

    79

    瀏覽量

    4263

原文標(biāo)題:商湯王曉剛:世界模型帶來智能駕駛3.0階段

文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    2026聯(lián)想創(chuàng)新科技大會即將啟幕

    聯(lián)想創(chuàng)新科技大會(Lenovo Tech World @ CES)官網(wǎng)于近日正式上線(點擊“閱讀原文”),這場史上最大規(guī)模的全球科技盛宴將于1月6日登陸拉斯維加斯地標(biāo)場館Sphere,重磅亮相
    的頭像 發(fā)表于 11-14 15:15 ?397次閱讀

    臨港汽車軟件聯(lián)盟正式成立!于2025軟件大會開啟“軟件定義汽車”新篇章|新聞速遞

    裘薇為首批成員單位授牌。聯(lián)盟由RT-Thread睿賽德、寧德時代智能、滴水智行、商湯、知從科技等企業(yè)共同發(fā)起,旨在推動臨港新片區(qū)汽車軟件產(chǎn)業(yè)協(xié)同創(chuàng)新,構(gòu)建開放
    的頭像 發(fā)表于 11-13 19:06 ?5723次閱讀
    臨港<b class='flag-5'>汽車</b>軟件聯(lián)盟正式成立!于2025軟件<b class='flag-5'>大會</b>開啟“軟件定義<b class='flag-5'>汽車</b>”新篇章|新聞速遞

    潤芯微科技亮相2025榮耀全球開發(fā)者大會

    10 月 23 日,2025 榮耀全球開發(fā)者大會AI 終端生態(tài)大會在深圳盛大開幕。作為智能終端領(lǐng)域的重要參與者,潤芯微科技攜核心產(chǎn)品與技術(shù)亮相
    的頭像 發(fā)表于 10-28 16:58 ?488次閱讀

    QNX亮相2025未來汽車AI計算大會

    由蓋世汽車主辦的第五屆未來汽車AI計算大會于9月10日至11日成功舉行。本次大會歷時一天半,大會
    的頭像 發(fā)表于 09-16 16:26 ?799次閱讀

    商湯亮相2025長安汽車科技生態(tài)大會

    9月5日-8日,商湯受邀參加2025世界智能產(chǎn)業(yè)博覽會「長安汽車科技生態(tài)大會」,作為長安汽車
    的頭像 發(fā)表于 09-10 16:33 ?1373次閱讀

    臺達(dá)于2025中國智算產(chǎn)業(yè)綠色科技大會推出全球可持續(xù)AI報告

    臺達(dá)受邀出席"2025中國智算產(chǎn)業(yè)綠色科技大會",全方位分享臺達(dá)在智算領(lǐng)域的前沿洞見與綠色解決方案。臺達(dá)-中達(dá)電通總經(jīng)理宮鴻華在大會主論壇上以《從電網(wǎng)到芯片:臺達(dá)在AI變革下
    的頭像 發(fā)表于 08-30 15:10 ?1242次閱讀

    商湯攜手NVIDIA亮相第三屆鏈博會

    近日,第三屆中國國際供應(yīng)鏈促進(jìn)博覽會(以下簡稱鏈博會)在北京隆重開幕,全球人工智能領(lǐng)軍企業(yè)NVIDIA(英偉達(dá))首次參展鏈博會,亮相NVIDIA展臺。
    的頭像 發(fā)表于 07-30 10:40 ?973次閱讀

    西井科技亮相2025全球航運科技大會

    近日,由航運界網(wǎng)主辦的2025全球航運科技大會在上海成功舉行。西井科技榮獲大會頒布的2025年航運界十大科技創(chuàng)新應(yīng)用獎;西井科技副總裁俞銘琪受邀出席大會,并在 “智能港口建設(shè)與運營”
    的頭像 發(fā)表于 06-20 14:45 ?871次閱讀

    工信部辛國斌到訪上海車展商湯影展臺

    近日,工業(yè)和信息化部副部長辛國斌一行到訪上海車展商湯影展臺。商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、商湯
    的頭像 發(fā)表于 04-30 11:51 ?588次閱讀

    商湯亮相2025上海車展

    近日,第二十一屆上海國際汽車工業(yè)展覽會(下稱“2025上海車展”)隆重開幕,商湯攜系列生成式AI汽車
    的頭像 發(fā)表于 04-27 10:44 ?691次閱讀

    2025年聯(lián)想創(chuàng)新科技大會即將開幕

    正式定檔!2025年聯(lián)想創(chuàng)新科技大會(Tech World),將于5月7日在上海世博中心精彩開幕。大會以“Smarter AI for all 讓AI成為創(chuàng)新生產(chǎn)力”為主題,將聚焦混合
    的頭像 發(fā)表于 04-15 15:58 ?710次閱讀

    商湯王曉剛亮相NVIDIA GTC 2025并發(fā)表主題演講

    商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、商湯CEO王曉剛在NVIDIA GTC 2025發(fā)表演講《激發(fā)通用人工智能的創(chuàng)造力,引領(lǐng)智能汽車走向全新
    的頭像 發(fā)表于 03-21 14:37 ?956次閱讀

    四維圖新亮相首屆大軍山·智能汽車科技大會

    近日,由武漢經(jīng)濟(jì)技術(shù)開發(fā)區(qū)管委會、中國電動汽車百人會和中國國際貿(mào)易促進(jìn)委員會機(jī)械行業(yè)分會聯(lián)合主辦的大軍山·智能汽車科技大會(2024)在武漢舉辦。會議以“迎接汽車全面智能化時代”為主題
    的頭像 發(fā)表于 12-24 17:06 ?964次閱讀

    東軟集團(tuán)亮相首屆大軍山·智能汽車科技大會

    近日,由中國電動汽車百人會主辦的大軍山·智能汽車科技大會(2024)在武漢成功舉辦。作為智能汽車領(lǐng)域的重要盛會,大會以“迎接
    的頭像 發(fā)表于 12-24 09:42 ?648次閱讀

    商湯首發(fā)智能座艙大模型創(chuàng)新產(chǎn)品

    近日,2024「實力AI DAY」舉辦。
    的頭像 發(fā)表于 11-29 09:53 ?738次閱讀