近日,國(guó)際頂級(jí)人工智能會(huì)議ICLR 2026(International Conference on Learning Representations,國(guó)際表征學(xué)習(xí)大會(huì))公布論文接收結(jié)果。西井科技攜手同濟(jì)大學(xué)長(zhǎng)聘教授、上海創(chuàng)智學(xué)院全時(shí)導(dǎo)師陳廣,共有3篇人工智能研究成果被大會(huì)正式錄用。作為全球人工智能領(lǐng)域最具影響力的學(xué)術(shù)會(huì)議之一,ICLR 致力于推動(dòng)深度學(xué)習(xí)與表征學(xué)習(xí)的前沿突破。此次三篇論文同時(shí)入選,不僅彰顯西井科技在基礎(chǔ)研究方面的深厚積累,也標(biāo)志著公司與同濟(jì)大學(xué)在人工智能“產(chǎn)學(xué)研”深度融合上再獲重要成果。
此次入選的三篇論文分別聚焦于大場(chǎng)景三維重建、多智能體協(xié)同視覺(jué)導(dǎo)航、開(kāi)放環(huán)境下的點(diǎn)云語(yǔ)義分割三大前沿方向。這些成果緊密圍繞大規(guī)模環(huán)境建模、多智能體協(xié)同規(guī)劃與開(kāi)放場(chǎng)景感知等核心挑戰(zhàn),不僅推動(dòng)了學(xué)術(shù)前沿,也為西井科技下一代自動(dòng)駕駛系統(tǒng)在港口、機(jī)場(chǎng)、工廠、園區(qū)等典型復(fù)雜真實(shí)環(huán)境中的落地提供了重要支撐。
論文一:面向大規(guī)模場(chǎng)景重建的信號(hào)結(jié)構(gòu)感知高斯?jié)姙R技術(shù)
Signal Structure-Aware Gaussian Splatting for Large-Scale Scene Reconstruction

高斯?jié)姙R(Gaussian Splatting)在新視角合成任務(wù)中展現(xiàn)了顯著潛力。與小規(guī)模場(chǎng)景相比,大規(guī)模場(chǎng)景不可避免地包含觀測(cè)稀疏區(qū)域,其初始點(diǎn)云往往極度稀疏。在這種情況下,若直接利用高頻圖像對(duì)由低頻稀疏點(diǎn)初始化的高斯基元進(jìn)行監(jiān)督,容易引發(fā)失控的密化過(guò)程并生成大量冗余基元,從而同時(shí)損害訓(xùn)練效率與重建質(zhì)量。
我們從信號(hào)恢復(fù)的角度重新審視三維重建的過(guò)程,場(chǎng)景的訓(xùn)練調(diào)度可總結(jié)為如下方式:一是通過(guò)控制高斯密化過(guò)程來(lái)調(diào)節(jié)目標(biāo)信號(hào)頻率,二是通過(guò)調(diào)整圖像分辨率來(lái)調(diào)節(jié)采樣頻率。然而,現(xiàn)有調(diào)度方法大多采用硬編碼規(guī)則,難以感知并自適應(yīng)場(chǎng)景頻率的收斂行為。為此,我們從信號(hào)結(jié)構(gòu)恢復(fù)的視角重新審視場(chǎng)景重建問(wèn)題,提出了一種新的調(diào)度器 SIG(Synchronizing Image supervision with Gaussian frequencies),用于實(shí)現(xiàn)圖像監(jiān)督與高斯頻率的動(dòng)態(tài)同步。具體而言,我們推導(dǎo)了三維表示的平均采樣頻率與帶寬,并據(jù)此根據(jù)場(chǎng)景頻率的收斂狀態(tài)自適應(yīng)地調(diào)節(jié)訓(xùn)練圖像分辨率與高斯密化進(jìn)程。
此外,我們引入了球約束高斯(Sphere-Constrained Gaussians),利用初始化點(diǎn)云的空間先驗(yàn)對(duì)高斯優(yōu)化過(guò)程進(jìn)行有效約束。該框架實(shí)現(xiàn)了頻率一致、具備幾何感知且無(wú)漂浮偽影的訓(xùn)練過(guò)程,在大規(guī)模場(chǎng)景中在效率與渲染質(zhì)量?jī)煞矫婢燥@著優(yōu)勢(shì)達(dá)到了當(dāng)前最先進(jìn)水平。
論文二:協(xié)作長(zhǎng)視程視覺(jué)語(yǔ)言導(dǎo)航基準(zhǔn)CoNavBench
CoNavBench: Collaborative Long-Horizon Vision-Language Navigation Benchmark

視覺(jué)語(yǔ)言導(dǎo)航(VLN)目前主要集中于以單智能體為中心的方法,通過(guò)逐步執(zhí)行人類指令來(lái)完成任務(wù)。然而,在需求密集或存在并行工作流的真實(shí)環(huán)境中,協(xié)作式 VLN 展現(xiàn)了顯著優(yōu)勢(shì),能通過(guò)并行處理和角色分工縮短完工時(shí)間并增強(qiáng)系統(tǒng)魯棒性。與此同時(shí),協(xié)作式 VLN 也引入了單智能體模型所忽視的新挑戰(zhàn),如擁堵、交接錯(cuò)誤以及匯合時(shí)機(jī)把控。
鑒于現(xiàn)有數(shù)據(jù)集和評(píng)估協(xié)議仍以單智能體為中心,忽略了協(xié)作輔助的機(jī)會(huì)與機(jī)器人間的干擾,我們提出了協(xié)作式長(zhǎng)航程 VLN 基準(zhǔn)(CoNavBench)。該基準(zhǔn)包含 4048 個(gè)具有圖級(jí)標(biāo)注的單體與協(xié)作任務(wù)序列,并定義了一套控制交接風(fēng)格與匯合模式的協(xié)作分類法。為了實(shí)現(xiàn)大規(guī)模的數(shù)據(jù)生成與評(píng)估,我們構(gòu)建了自動(dòng)化圖結(jié)構(gòu)生成平臺(tái) NavCraft,采用兩階段分層架構(gòu)來(lái)規(guī)劃任務(wù)、分配子目標(biāo)并驗(yàn)證交接點(diǎn)。智能體在基于 Habitat-Sim 的場(chǎng)景圖閉環(huán)中運(yùn)行,支持可達(dá)性檢測(cè)、耗時(shí)預(yù)估等,并能通過(guò)效率工具庫(kù)進(jìn)行調(diào)度迭代。作為參考,我們基于 Qwen2.5-VL-3B 微調(diào)協(xié)作基線模型。實(shí)驗(yàn)證明,在 CoNavBench 上訓(xùn)練的協(xié)作策略在任務(wù)效率和可靠性上均優(yōu)于單機(jī)器人,提升單機(jī)器人在 step-level 任務(wù)成功率約 18.11% 。
論文三:用于點(diǎn)云開(kāi)集測(cè)試時(shí)自適應(yīng)的幾何引導(dǎo)分布外建模方法GOOD
GOOD: Geometry-guided Out-of-Distribution Modeling for Open-set Test-time Adaptation in Point Cloud Semantic Segmentation

開(kāi)集測(cè)試時(shí)自適應(yīng)(OSTTA)目前主要集中于 2D 圖像領(lǐng)域,旨在解決在線模型優(yōu)化與開(kāi)放場(chǎng)景識(shí)別的挑戰(zhàn)。然而,在 3D 點(diǎn)云語(yǔ)義分割的真實(shí)環(huán)境中,點(diǎn)云數(shù)據(jù)的無(wú)序性與已知(ID)及未知(OOD)樣本間的極度失衡帶來(lái)了顯著困難,導(dǎo)致現(xiàn)有方法難以捕捉幾何先驗(yàn)且易誤判稀疏的 OOD 實(shí)例 。
鑒于現(xiàn)有技術(shù)在處理 OOD 樣本稀疏甚至缺失時(shí)的局限性,我們提出了幾何引導(dǎo)的離群分布建模(GOOD)框架。該框架利用幾何聚類將點(diǎn)云轉(zhuǎn)化為超點(diǎn)以緩解數(shù)值差異,并定義了一套結(jié)合純度與熵的置信度指標(biāo)配合高斯混合模型進(jìn)行初步篩選。為了增強(qiáng)判別魯棒性,我們構(gòu)建了超點(diǎn) ID 原型策略與時(shí)間偽標(biāo)簽分支,通過(guò)原型細(xì)化與時(shí)序一致性約束來(lái)生成可靠的監(jiān)督信號(hào)。實(shí)驗(yàn)證明,GOOD 在四個(gè)基準(zhǔn)數(shù)據(jù)集上的表現(xiàn)均優(yōu)于現(xiàn)有方法,特別是在 Synth4D 到 SemanticKITTI 任務(wù)中,其 AUROC 和 FPR95 分別提升了 8.99% 與 7.91% 。
作為深耕AI和智慧物流領(lǐng)域的科創(chuàng)企業(yè),西井科技積累了豐富的多場(chǎng)景產(chǎn)業(yè)應(yīng)用經(jīng)驗(yàn);而同濟(jì)大學(xué)作為國(guó)內(nèi)智能交通領(lǐng)域的頂尖高校,在人才培養(yǎng)、基礎(chǔ)研究方面擁有得天獨(dú)厚的優(yōu)勢(shì),能夠?yàn)楫a(chǎn)業(yè)創(chuàng)新提供源源不斷的技術(shù)支撐與人才供給。未來(lái),西井科技將繼續(xù)與同濟(jì)大學(xué)等高校持續(xù)深化合作,進(jìn)一步推動(dòng)更多前沿技術(shù)從實(shí)驗(yàn)室走向產(chǎn)業(yè)一線,賦能海港、空港、工廠、園區(qū)等場(chǎng)景的智能化升級(jí),激活新質(zhì)生產(chǎn)力,共繪高質(zhì)量發(fā)展新藍(lán)圖!
-
AI
+關(guān)注
關(guān)注
91文章
39658瀏覽量
301263 -
人工智能
+關(guān)注
關(guān)注
1817文章
50083瀏覽量
265162 -
西井科技
+關(guān)注
關(guān)注
0文章
275瀏覽量
5785
原文標(biāo)題:西井科技與同濟(jì)大學(xué)合作三篇AI研究成果入選頂會(huì)ICLR 2026
文章出處:【微信號(hào):westwelllab,微信公眾號(hào):westwell西井科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
思特威于ISSCC 2026發(fā)表論文研究成果
光庫(kù)科技創(chuàng)新成果亮相APE 2026亞洲光電博覽會(huì)
后摩智能4篇論文入選人工智能頂會(huì)ICLR 2026
維智科技與同濟(jì)大學(xué)達(dá)成戰(zhàn)略合作
時(shí)識(shí)科技聯(lián)合創(chuàng)新成果SpikeRAM芯片入選ISSCC 2026
理想汽車12篇論文入選全球五大AI頂會(huì)
沐曦聯(lián)合香港科技大學(xué)登上AI頂會(huì)
奧托立夫與同濟(jì)大學(xué)交通學(xué)院深化合作
Nullmax端到端自動(dòng)駕駛最新研究成果入選ICCV 2025
NVIDIA在ICRA 2025展示多項(xiàng)最新研究成果
后摩智能四篇論文入選三大國(guó)際頂會(huì)
西井科技入選2025數(shù)字經(jīng)濟(jì)實(shí)踐案例集
東軟與同濟(jì)大學(xué)共建未來(lái)車載人工智能聯(lián)合實(shí)驗(yàn)室
格陸博科技受邀同濟(jì)大學(xué)分享底盤域技術(shù)創(chuàng)新
同濟(jì)大學(xué)、香港城市大學(xué):在連續(xù)譜束縛態(tài)局域聲能增強(qiáng)與傳感方向取得進(jìn)展
西井科技攜手同濟(jì)大學(xué) 三篇AI研究成果入選頂會(huì)ICLR 2026
評(píng)論