這段時(shí)間,物理AI這個(gè)詞被黃仁勛反復(fù)提及,也迅速成為AI圈的新熱詞。
但說(shuō)實(shí)話,很多討論都停留在表層,要么把它等同于更聰明的機(jī)器人,要么泛泛而談歸為AI進(jìn)入現(xiàn)實(shí)世界。
真正的問(wèn)題其實(shí)是:物理AI到底是什么?它在技術(shù)原理上和我們熟悉的大模型、傳統(tǒng)機(jī)器人,究竟有什么根本不同?
物理AI并不是“又一個(gè)機(jī)器人概念”
很多人第一次聽(tīng)到“物理AI”,第一反應(yīng)是機(jī)器人。
但如果只把它理解為“更聰明的機(jī)器人”,那基本等于沒(méi)理解。
機(jī)器人只是物理AI的一種載體,而不是本質(zhì)。
物理AI,是能夠感知物理世界狀態(tài)、在物理規(guī)律約束下進(jìn)行預(yù)測(cè)與決策,并通過(guò)動(dòng)作持續(xù)影響現(xiàn)實(shí)世界的智能系統(tǒng)。
這和我們熟悉的語(yǔ)言模型,有著本質(zhì)區(qū)別。
我們訓(xùn)練模型去理解文字、圖片、語(yǔ)音、代碼,本質(zhì)上都是在一個(gè)離散、可抽象、可回滾的符號(hào)空間里做推理。即便是看起來(lái)最復(fù)雜的語(yǔ)言模型,其核心任務(wù)依然是在已有上下文中,預(yù)測(cè)下一個(gè)最合理的符號(hào)。
但當(dāng)AI被要求走出屏幕,進(jìn)入工廠、道路、倉(cāng)庫(kù)、城市時(shí),問(wèn)題立刻變了。
現(xiàn)實(shí)世界不是由token組成的,而是:
連續(xù)變化的空間
不完全可觀測(cè)的狀態(tài)
真實(shí)存在的物理約束
一旦出錯(cuò)就無(wú)法撤銷(xiāo)的后果
在這樣的環(huán)境中,答得像不像人已經(jīng)不重要了,系統(tǒng)是否穩(wěn)定、安全、可控才是第一位的。
物理世界是連續(xù)的、不可回滾的。一個(gè)判斷失誤,可能是設(shè)備損壞、生產(chǎn)事故,甚至人身風(fēng)險(xiǎn)。
這意味著,AI一旦進(jìn)入物理世界,就必須同時(shí)具備三種能力:
第一,對(duì)真實(shí)環(huán)境的感知能力。不是識(shí)別圖片,而是理解空間、距離、結(jié)構(gòu)、物體屬性,甚至觸覺(jué)與力的變化。
第二,在物理規(guī)律約束下的推理能力。重力、摩擦、碰撞、延遲、不確定性,這些都不是token,而是必須認(rèn)真對(duì)待的現(xiàn)實(shí)。
第三,動(dòng)作與反饋形成閉環(huán)的控制能力。輸出不再是文字,而是實(shí)時(shí)控制信號(hào);錯(cuò)誤不再是答非所問(wèn),而是系統(tǒng)失控。
從這一刻起,AI不再只是建議者,而是開(kāi)始成為執(zhí)行者。
物理 AI vs. 具身智能
具身智能與物理 AI 經(jīng)常被混用,但二者關(guān)注的并不是同一個(gè)層面的問(wèn)題。
具身智能關(guān)心的是智能如何產(chǎn)生。它以具身認(rèn)知為出發(fā)點(diǎn),強(qiáng)調(diào)通過(guò)傳感器-執(zhí)行器的直接交互,在真實(shí)或仿真環(huán)境中“做中學(xué)”。智能被視為一種從經(jīng)驗(yàn)中涌現(xiàn)的能力,重點(diǎn)在于學(xué)習(xí)效率、技能泛化和感知?jiǎng)幼鏖]環(huán)本身,而不是系統(tǒng)是否長(zhǎng)期穩(wěn)定運(yùn)行。
物理 AI 則關(guān)心智能是否可以被信任地運(yùn)行在現(xiàn)實(shí)世界中。它不僅包含具身感知與學(xué)習(xí),還必須融合物理約束、實(shí)時(shí)決策、動(dòng)態(tài)控制以及安全與倫理邊界。在物理 AI 體系中,失敗不再只是訓(xùn)練成本,而是真實(shí)的物理后果,因此系統(tǒng)需要可驗(yàn)證、可解釋、可退化的工程設(shè)計(jì)。
一句話總結(jié):具身智能解決智能怎么學(xué)會(huì)動(dòng),而物理 AI 解決動(dòng)起來(lái)之后,系統(tǒng)能不能長(zhǎng)期、安全地工作。
物理AI是如何工作的?
物理AI的工作方式是持續(xù)感知世界、理解正在發(fā)生什么、判斷接下來(lái)可能發(fā)生什么,然后在現(xiàn)實(shí)世界中安全地采取行動(dòng)。真正的難點(diǎn)在于,這一整套過(guò)程必須在真實(shí)物理約束下、以極低延遲、并且?guī)缀醪荒芊稿e(cuò)地完成。
從看見(jiàn)世界開(kāi)始:感知并不是識(shí)別,而是建模
物理AI的第一步,并不是理解任務(wù),而是理解它所處的環(huán)境本身。為此,系統(tǒng)需要通過(guò)各種傳感器獲取關(guān)于現(xiàn)實(shí)世界的原始信息,例如:
攝像頭提供的是連續(xù)變化的圖像和視頻,讓系統(tǒng)能夠感知物體的形狀、位置和運(yùn)動(dòng);
雷達(dá)和激光雷達(dá)補(bǔ)充了精確的空間深度信息,使機(jī)器能夠在三維空間中定位自身并識(shí)別障礙物;
麥克風(fēng)讓系統(tǒng)能夠感知聲音變化,從而識(shí)別語(yǔ)音指令或異常噪聲;
加速度計(jì)、陀螺儀等慣性傳感器則是持續(xù)反饋系統(tǒng)自身的姿態(tài)、速度和運(yùn)動(dòng)狀態(tài)。
但這些傳感器數(shù)據(jù)本身并沒(méi)有意義。
物理AI面臨的第一個(gè)技術(shù)挑戰(zhàn),是如何把這些高度嘈雜、不同模態(tài)、不同時(shí)間尺度的數(shù)據(jù),整合成一個(gè)可用于決策的世界狀態(tài)表示。這一步,遠(yuǎn)比看清楚一張圖片要復(fù)雜得多。
理解世界正在發(fā)生什么:從感知到處理
當(dāng)感知數(shù)據(jù)被采集后,真正的計(jì)算才開(kāi)始。
通過(guò)機(jī)器學(xué)習(xí)(ML)和深度學(xué)習(xí)(DL)等先進(jìn)算法,物理AI系統(tǒng)會(huì)對(duì)多源感官信息進(jìn)行融合處理,從中提取結(jié)構(gòu)化特征,理解環(huán)境中的物體、空間關(guān)系以及動(dòng)態(tài)變化趨勢(shì)。
更重要的是,這種理解并不要求世界是完全可觀測(cè)的。
現(xiàn)實(shí)環(huán)境中,總會(huì)存在遮擋、噪聲和信息缺失。因此,物理AI必須具備在不完整信息下進(jìn)行推斷的能力。例如,當(dāng)機(jī)器人檢測(cè)到人類(lèi)正在接近時(shí),它并不需要精確知道對(duì)方的每一個(gè)動(dòng)作細(xì)節(jié),而是要能夠判斷對(duì)方是否可能進(jìn)入危險(xiǎn)區(qū)域、是否需要提前讓行或減速即可。在這一階段,空間感知能力變得至關(guān)重要。系統(tǒng)通常會(huì)構(gòu)建二維或三維地圖,用來(lái)持續(xù)更新對(duì)環(huán)境的理解,并為后續(xù)的規(guī)劃和控制提供基礎(chǔ)。
決策的本質(zhì):在物理約束下預(yù)測(cè)未來(lái)
理解“現(xiàn)在發(fā)生了什么”只是第一步,真正的智能體必須回答一個(gè)更難的問(wèn)題:如果我采取某個(gè)動(dòng)作,接下來(lái)會(huì)發(fā)生什么?
這正是物理AI與語(yǔ)言AI的關(guān)鍵分水嶺。
在現(xiàn)實(shí)世界中,決策并不是選擇一句最合理的話,而是在多種可能行為中,評(píng)估它們?cè)谖磥?lái)一段時(shí)間內(nèi)帶來(lái)的物理后果。
自動(dòng)駕駛汽車(chē)在看到行人橫穿馬路時(shí),不只是“識(shí)別到一個(gè)人”,而是要實(shí)時(shí)判斷剎車(chē)、減速或變道分別會(huì)導(dǎo)致怎樣的風(fēng)險(xiǎn)和結(jié)果。
這種決策過(guò)程必須是實(shí)時(shí)的,并且能夠應(yīng)對(duì)突發(fā)事件。例如,自主無(wú)人機(jī)在復(fù)雜環(huán)境中飛行時(shí),需要不斷根據(jù)新的傳感器反饋調(diào)整路徑,動(dòng)態(tài)避開(kāi)障礙物,而不是沿著一條預(yù)先規(guī)劃好的路線盲目前進(jìn)。
在多變量環(huán)境下,系統(tǒng)還需要對(duì)任務(wù)進(jìn)行優(yōu)先級(jí)排序,在安全性、效率和目標(biāo)完成度之間做出權(quán)衡。
回到現(xiàn)實(shí):行動(dòng)執(zhí)行才是不可回滾的一步
當(dāng)物理AI做出決策后,必須通過(guò)執(zhí)行器把數(shù)字世界中的判斷,轉(zhuǎn)化為真實(shí)的物理動(dòng)作。
電機(jī)驅(qū)動(dòng)車(chē)輪、機(jī)械臂操作物體、壓力傳感器可以施加力。這些執(zhí)行動(dòng)作一旦發(fā)生,就無(wú)法撤銷(xiāo),也無(wú)法重來(lái)一遍。
這正是物理AI對(duì)系統(tǒng)穩(wěn)定性和可靠性要求極高的原因。
在自動(dòng)駕駛場(chǎng)景,執(zhí)行器需要幫助車(chē)輛進(jìn)行導(dǎo)航、轉(zhuǎn)向、加速、制動(dòng)、爬坡或解鎖車(chē)門(mén)。在與人類(lèi)直接交互的場(chǎng)景中,執(zhí)行器不僅要完成任務(wù),還需要以自然、可理解的方式行動(dòng),例如模擬人類(lèi)的動(dòng)作、表情或語(yǔ)音輸出,從而建立安全、可信的互動(dòng)關(guān)系。
持續(xù)學(xué)習(xí)與適應(yīng):智能并不是一次性完成的
即便系統(tǒng)已經(jīng)部署,物理AI的學(xué)習(xí)也不會(huì)停止。
通過(guò)強(qiáng)化學(xué)習(xí)等方法,系統(tǒng)可以在執(zhí)行任務(wù)的過(guò)程中不斷接收反饋,根據(jù)成功或失敗的結(jié)果調(diào)整自身策略。這種學(xué)習(xí)方式使物理AI能夠逐步適應(yīng)更加復(fù)雜或未知的環(huán)境。
例如,自動(dòng)駕駛系統(tǒng)可以在不同交通條件下,逐漸學(xué)會(huì)更準(zhǔn)確地預(yù)測(cè)行人和其他車(chē)輛的行為;倉(cāng)庫(kù)機(jī)器人也可以通過(guò)持續(xù)運(yùn)行,適應(yīng)新的貨架布局或臨時(shí)障礙物。
這種能力,使物理AI不再是只能在固定場(chǎng)景下工作的自動(dòng)化設(shè)備,而是具備一定環(huán)境遷移能力的智能系統(tǒng)。
正是通過(guò)感知、理解、決策、行動(dòng)和持續(xù)學(xué)習(xí)形成的閉環(huán),物理AI才得以在機(jī)器人、自動(dòng)駕駛、醫(yī)療、制造等領(lǐng)域中,處理那些真正復(fù)雜、不可抽象為純數(shù)據(jù)的問(wèn)題。讓數(shù)字世界中的計(jì)算、推理和學(xué)習(xí),能夠穩(wěn)定、可靠地作用于現(xiàn)實(shí)物理世界。
物理AI都有哪些落地?
判斷一個(gè)技術(shù)概念是否成立,最直接的方式不是聽(tīng)它被如何定義,而是看誰(shuí)在為它投入長(zhǎng)期資源。從這個(gè)角度看,物理AI已經(jīng)明顯進(jìn)入了大廠的核心戰(zhàn)略區(qū),而不再停留在實(shí)驗(yàn)室層面。
英偉達(dá)以硬件+ 軟件 +模型全棧布局,構(gòu)建一個(gè)從虛擬訓(xùn)練(仿真)到現(xiàn)實(shí)部署的完整生態(tài)。英偉達(dá)并不直接制造機(jī)器人或汽車(chē),而是提供物理AI的“鏟子”和“操作系統(tǒng)”。

典型落地案例:
1. 人形機(jī)器人領(lǐng)域:與波士頓動(dòng)力合作,通過(guò)高保真物理仿真訓(xùn)練機(jī)器人平衡、操作能力。
2. 醫(yī)療健康領(lǐng)域:與 GE 醫(yī)療合作開(kāi)發(fā) Isaac for Healthcare 平臺(tái),通過(guò)物理 AI 優(yōu)化醫(yī)療機(jī)器人操作精度,在微創(chuàng)手術(shù)中實(shí)現(xiàn)亞毫米級(jí)控制,降低手術(shù)風(fēng)險(xiǎn)。
3. Omniverse與數(shù)字孿生:通過(guò)Omniverse平臺(tái),為工業(yè)界構(gòu)建高保真的虛擬環(huán)境,讓機(jī)器人在虛擬世界中進(jìn)行百萬(wàn)次的訓(xùn)練和試錯(cuò),再部署到現(xiàn)實(shí)世界。

英偉達(dá)的核心優(yōu)勢(shì)在于虛實(shí)閉環(huán)能力,通過(guò) Cosmos 模型生成符合物理規(guī)律的合成數(shù)據(jù),結(jié)合真實(shí)場(chǎng)景數(shù)據(jù)雙向校準(zhǔn),解決物理 AI 訓(xùn)練數(shù)據(jù)不足的行業(yè)痛點(diǎn);同時(shí),Omniverse 平臺(tái)實(shí)現(xiàn)多物理場(chǎng)耦合仿真,為模型提供高保真的虛擬訓(xùn)練環(huán)境,大幅提升物理 AI 的跨場(chǎng)景遷移能力。
谷歌
谷歌通過(guò)DeepMind和Google Research主導(dǎo)了物理 AI 的前沿算法研究,強(qiáng)調(diào)無(wú)監(jiān)督物理學(xué)習(xí)和通用機(jī)器人智能。

典型落地案例
1. 機(jī)器人領(lǐng)域:與波士頓動(dòng)力合作,將 Gemini Robotics 部署于 Atlas 人形機(jī)器人與 Spot 四足機(jī)器人,讓 Atlas 在未知環(huán)境中完成復(fù)雜操作(如搬運(yùn)異形物體、跨越障礙)。

2. AR 空間交互領(lǐng)域:Project Aura AR 眼鏡通過(guò) Gemini 與空間計(jì)算芯片融合,實(shí)現(xiàn)物理環(huán)境的實(shí)時(shí)感知與交互,如烹飪時(shí) AR 食譜隨動(dòng)作更新,機(jī)艙內(nèi)懸浮虛擬屏隨頭部轉(zhuǎn)動(dòng)調(diào)整位置。
谷歌的核心優(yōu)勢(shì)在于大模型+空間理解的融合能力,Gemini 不僅能理解語(yǔ)言與視覺(jué)信息,還能嵌入物理規(guī)律與空間知識(shí),實(shí)現(xiàn)感知-推理-行動(dòng)的跨模態(tài)閉環(huán);同時(shí),Project Aura 推動(dòng)物理 AI 從專業(yè)場(chǎng)景走向消費(fèi)級(jí)應(yīng)用,開(kāi)啟物理世界智能交互的新范式。
特斯拉堅(jiān)持垂直整合,以產(chǎn)品(汽車(chē)、機(jī)器人)為載體,利用其龐大的車(chē)隊(duì)和未來(lái)機(jī)器人的實(shí)際運(yùn)行數(shù)據(jù),形成數(shù)據(jù)反哺算法的獨(dú)特閉環(huán)。

典型落地案例:
1. 自動(dòng)駕駛領(lǐng)域:FSD V14實(shí)現(xiàn)0接管橫穿美國(guó),純視覺(jué)方案不依賴高精地圖,通過(guò)物理規(guī)律嵌入解決極端天氣、道路施工等復(fù)雜場(chǎng)景的決策問(wèn)題,被稱為“首個(gè)通過(guò)物理圖靈測(cè)試的AI系統(tǒng)”。

2. 工廠自動(dòng)化領(lǐng)域:特斯拉工廠部署Optimus機(jī)器人,完成零部件搬運(yùn)、生產(chǎn)線巡檢等任務(wù),通過(guò)力覺(jué)傳感器感知物理環(huán)境,動(dòng)態(tài)調(diào)整操作力度。
特斯拉的核心優(yōu)勢(shì)在于真實(shí)物理數(shù)據(jù)驅(qū)動(dòng)通過(guò)數(shù)百萬(wàn)輛汽車(chē)的路測(cè)數(shù)據(jù)與Optimus機(jī)器人的真實(shí)操作數(shù)據(jù),訓(xùn)練出具備強(qiáng)大物理世界適應(yīng)能力的AI模型;FSD V14的端到端架構(gòu)摒棄傳統(tǒng)模塊化設(shè)計(jì),直接從圖像輸入生成控制輸出,更符合人類(lèi)駕駛的決策邏輯,大幅提升物理世界的交互效率。
結(jié)語(yǔ)
回過(guò)頭來(lái)看,所謂物理AI,并不是黃仁勛憑空造出的一個(gè)新詞,也不是對(duì)機(jī)器人、自動(dòng)駕駛的簡(jiǎn)單包裝。它真正指向的,是一條正在逐步清晰的技術(shù)路徑:讓 AI 從理解世界走向參與世界。
倉(cāng)儲(chǔ)機(jī)器人、自動(dòng)駕駛、工業(yè)機(jī)器人、具身智能設(shè)備,都已經(jīng)在真實(shí)環(huán)境中承擔(dān)生產(chǎn)任務(wù)、創(chuàng)造效率和收益。這也決定了物理 AI 不會(huì)像某些 AI 概念一樣曇花一現(xiàn)。
可以預(yù)見(jiàn)的是,在未來(lái)相當(dāng)長(zhǎng)的一段時(shí)間里,物理 AI 都不會(huì)是一個(gè)爆點(diǎn)式的賽道,而更像是一條持續(xù)爬坡的工程曲線。它的發(fā)展速度,取決于算力成本、硬件成熟度、算法穩(wěn)定性,以及對(duì)物理世界理解的不斷加深。
參考:
《Fundamentals of Physical AI》
《Physical AI: Bridging the Sim-to-Real Divide Toward Embodied, Ethical, and Autonomous Intelligence》
https://www.nvidia.com/en-us/glossary/generative-physical-ai/
https://blogs.nvidia.com/blog/three-computers-robotics/
https://www.hpe.com/us/en/what-is/physical-ai.html
-
AI
+關(guān)注
關(guān)注
91文章
39043瀏覽量
299587 -
人工智能
+關(guān)注
關(guān)注
1814文章
49951瀏覽量
263588
發(fā)布評(píng)論請(qǐng)先 登錄
Rubin平臺(tái)官宣量產(chǎn)!黃仁勛:機(jī)器人的ChatGPT時(shí)刻已至
中國(guó)AI市場(chǎng)有望達(dá)500億美元!黃仁勛:錯(cuò)失中國(guó)市場(chǎng)將損失巨大
黃仁勛中國(guó)行的背后,AI芯片暗戰(zhàn)與英偉達(dá)生存博弈
今日看點(diǎn)|黃仁勛:物理AI的ChatGPT時(shí)刻已然到來(lái);波士頓動(dòng)力發(fā)布Atlas人形機(jī)器人量產(chǎn)版本
黃仁勛:未來(lái)十年很多汽車(chē)是自動(dòng)駕駛 英偉達(dá)發(fā)布Alpamayo汽車(chē)大模型平臺(tái)
黃仁勛新年第一場(chǎng)演講提了DeepSeek 黃仁勛:機(jī)器人領(lǐng)域迎來(lái)ChatGPT時(shí)刻
NVIDIA CEO黃仁勛暢談AI時(shí)代最新藍(lán)圖
央視專訪英偉達(dá)創(chuàng)始人黃仁勛 黃仁勛:總感覺(jué)公司快倒閉了
NVIDIA CEO 黃仁勛在美國(guó)和中國(guó)推廣 AI
NVIDIA英偉達(dá) GTC 巴黎亮點(diǎn):NVIDIA CEO黃仁勛公布?xì)W洲AI發(fā)展新藍(lán)圖
NVIDIA CEO黃仁勛展望AI基礎(chǔ)設(shè)施產(chǎn)業(yè)
看點(diǎn):黃仁勛:全球一半AI人才都是中國(guó)人 富士康將在印度投資15億美元
黃仁勛:人工智能將提高全球GDP 黃仁勛談中國(guó)AI市場(chǎng)未來(lái)規(guī)??蛇_(dá)500億美元
曝黃仁勛會(huì)見(jiàn)DeepSeek創(chuàng)始人梁文鋒
黃仁勛GTC2025演講:人工智能的終極形態(tài)物理AI將徹底改變世界
一文讀懂:黃仁勛重點(diǎn)布局的“物理AI”(Physic AI)
評(píng)論