近日,機(jī)器學(xué)習(xí)與計(jì)算神經(jīng)科學(xué)領(lǐng)域全球頂級(jí)學(xué)術(shù)頂級(jí)會(huì)議NeurIPS 2025公布論文錄用結(jié)果,思必馳-上海交大聯(lián)合實(shí)驗(yàn)室共有5篇論文被收錄。NeurIPS(Conference on Neural Information Processing Systems)是機(jī)器學(xué)習(xí)與計(jì)算神經(jīng)科學(xué)領(lǐng)域的頂級(jí)學(xué)術(shù)盛會(huì),長(zhǎng)期匯聚來自學(xué)術(shù)界與產(chǎn)業(yè)界的最新突破,具有廣泛而深遠(yuǎn)的國(guó)際影響力。
本次收錄的論文成果聚焦大模型訓(xùn)練與指令微調(diào)的數(shù)據(jù)工程、可解釋表征與穩(wěn)健泛化等前沿方向,為思必馳大模型人機(jī)對(duì)話產(chǎn)品的核心能力提供技術(shù)支撐。相關(guān)研究成果在實(shí)際應(yīng)用中,支撐了多智能體協(xié)同與復(fù)雜任務(wù)拆解執(zhí)行、提升了Agent的自治規(guī)劃與容錯(cuò)能力,在端到端語(yǔ)音理解與生成中實(shí)現(xiàn)了更高的魯棒性與跨模態(tài)一致性,同時(shí)為生態(tài)Agent的分發(fā)管控與個(gè)性化對(duì)話記憶提供了可解釋的模型基礎(chǔ)。這些進(jìn)展讓產(chǎn)品在車載語(yǔ)音、家庭助手、客服中臺(tái)等場(chǎng)景下,能夠以更穩(wěn)定、更智能、更自然的方式完成任務(wù)與交互,推動(dòng)人機(jī)協(xié)同體驗(yàn)的全面升級(jí)。下面介紹本次收錄的代表性成果:
指令微調(diào)的數(shù)據(jù)選取與可解釋表征學(xué)習(xí)
Task-Specific Data Selection for Instruction Tuning via Monosemantic Neuronal Activations
以模型內(nèi)部神經(jīng)元激活而非僅文本語(yǔ)義來表征樣本,并通過稀疏自編碼器將多義激活解耦為可解釋的“單義”特征,在稀疏空間完成任務(wù)對(duì)齊與相似度度量,實(shí)現(xiàn)更穩(wěn)健的數(shù)據(jù)精選,為企業(yè)級(jí)指令微調(diào)與垂直應(yīng)用提供“少而精”的數(shù)據(jù)基座。

論文簡(jiǎn)介:指令微調(diào)顯著提升了大語(yǔ)言模型對(duì)多樣化人類指令的遵循能力,但在特定目標(biāo)任務(wù)上取得更優(yōu)表現(xiàn)的關(guān)鍵瓶頸在于如何以盡可能小的代價(jià)挑選最相關(guān)的數(shù)據(jù)?,F(xiàn)有方法要么依賴易受噪聲與實(shí)現(xiàn)細(xì)節(jié)影響的影響力估計(jì),要么采用穩(wěn)定但高度依賴樣本表征質(zhì)量的分布對(duì)齊。而無(wú)論是BM25等淺層特征,還是BGE、LLM2Vec等神經(jīng)嵌入,都往往難以反映模型實(shí)際的內(nèi)部計(jì)算。為此,本文提出以模型為中心的數(shù)據(jù)選擇范式MONA:以基座模型特定層的神經(jīng)元激活直接表征樣本,使表示與模型決策過程同構(gòu)。再利用稀疏自編碼器將多義激活解耦為稀疏、可解釋的單義特征,并在該空間構(gòu)建更契合稀疏性的相似性度量以對(duì)齊目標(biāo)任務(wù)原型,從而穩(wěn)健打分并篩選候選樣本。覆蓋多數(shù)據(jù)源、多任務(wù)、多模型與多選取比例的系統(tǒng)實(shí)驗(yàn)表明,MONA在穩(wěn)定性與任務(wù)特定性能上持續(xù)優(yōu)于現(xiàn)有基線。在若干設(shè)置下,經(jīng)MONA精選的少量數(shù)據(jù)即可達(dá)到或超過全量微調(diào)的效果,同時(shí)顯著降低訓(xùn)練成本并提升可解釋性與遷移性。
長(zhǎng)期以來,思必馳深度參與國(guó)內(nèi)外學(xué)術(shù)前沿研究,在ICASSP、INTERSPEECH、ACL、EMNLP、AAAI、ICML、NeurIPS等頂級(jí)學(xué)術(shù)會(huì)議上屢獲佳績(jī),持續(xù)產(chǎn)出高質(zhì)量科研成果。思必馳-上海交大聯(lián)合實(shí)驗(yàn)室憑借一系列高水平論文,彰顯了在人工智能語(yǔ)音語(yǔ)言關(guān)鍵技術(shù)領(lǐng)域的深度探索和重大突破,為行業(yè)的發(fā)展注入了強(qiáng)大動(dòng)力。思必馳秉持科研與產(chǎn)業(yè)應(yīng)用緊密結(jié)合的理念,未來也將持續(xù)探索科技成果的應(yīng)用轉(zhuǎn)化。
作為專業(yè)的對(duì)話式人工智能平臺(tái)型企業(yè),思必馳具有源頭技術(shù)創(chuàng)新和應(yīng)用創(chuàng)新的能力,自2022年7月獲國(guó)家科技部批準(zhǔn)建設(shè)“語(yǔ)言計(jì)算國(guó)家新一代人工智能開放創(chuàng)新平臺(tái)”以來,接連于2023-2024年獲批組建蘇州市、江蘇省、長(zhǎng)三角三級(jí)創(chuàng)新聯(lián)合體,并于2025年攜手上海交通大學(xué)、蘇州大學(xué),牽頭組建“江蘇省語(yǔ)言計(jì)算及應(yīng)用重點(diǎn)實(shí)驗(yàn)室”,成為國(guó)家人工智能戰(zhàn)略科技力量的重要組成部分。
思必馳承擔(dān)了包括國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家發(fā)改委“互聯(lián)網(wǎng)+”重大工程和人工智能創(chuàng)新發(fā)展工程、國(guó)家工信部人工智能與實(shí)體經(jīng)濟(jì)深度融合項(xiàng)目、長(zhǎng)三角科技創(chuàng)新共同體聯(lián)合攻關(guān)計(jì)劃項(xiàng)目等十余項(xiàng)國(guó)家級(jí)、省部級(jí)項(xiàng)目,展現(xiàn)出卓越的科研實(shí)力與項(xiàng)目落地能力。
思必馳深耕語(yǔ)音語(yǔ)言領(lǐng)域,憑借自主研發(fā)的核心技術(shù)多次在國(guó)際研究機(jī)構(gòu)評(píng)測(cè)中奪得冠軍;曾三度斬獲國(guó)內(nèi)人工智能最高獎(jiǎng)“吳文俊獎(jiǎng)”,榮獲中國(guó)專利優(yōu)秀獎(jiǎng),以及信通院車載智能語(yǔ)音交互系統(tǒng)最高級(jí)別認(rèn)證等重要榮譽(yù)。技術(shù)創(chuàng)新能力備受全球矚目,被高盛全球人工智能報(bào)告列為關(guān)鍵參與者,也被Gartner評(píng)為東亞五大明星AI公司之一。
截至2024年年底,思必馳擁有近100項(xiàng)全球獨(dú)創(chuàng)技術(shù),已授權(quán)知識(shí)產(chǎn)權(quán)1597件,其中已授權(quán)發(fā)明專利633項(xiàng),參與了71項(xiàng)國(guó)家/行業(yè)/團(tuán)體標(biāo)準(zhǔn),獲得23項(xiàng)國(guó)家級(jí)的產(chǎn)品認(rèn)證。近期,大模型人機(jī)對(duì)話技術(shù)創(chuàng)新與產(chǎn)業(yè)賦能發(fā)展提速,思必馳堅(jiān)持自主的大模型技術(shù)路線,即“構(gòu)建可靠性優(yōu)先的1+N分布式智能體系統(tǒng):1 個(gè)中樞大模型+ N 個(gè)垂域模型及全鏈路交互組件組成全功能系統(tǒng)”,以任務(wù)型交互為核心,結(jié)合智能硬件感知優(yōu)勢(shì),構(gòu)建垂域大模型和中樞大模型系統(tǒng),服務(wù)企業(yè)客戶。
-
實(shí)驗(yàn)室
+關(guān)注
關(guān)注
0文章
300瀏覽量
20330 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8541瀏覽量
136236 -
思必馳
+關(guān)注
關(guān)注
4文章
373瀏覽量
15885
原文標(biāo)題:NeurIPS2025|思必馳-上海交大聯(lián)合實(shí)驗(yàn)室5篇論文被收錄
文章出處:【微信號(hào):思必馳,微信公眾號(hào):思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
地平線五篇論文入選NeurIPS 2025與AAAI 2026
理想汽車12篇論文入選全球五大AI頂會(huì)
思必馳入選2025年度視聽系統(tǒng)典型案例
強(qiáng)強(qiáng)聯(lián)合:之江實(shí)驗(yàn)室與沐曦股份共建智算集群聯(lián)合實(shí)驗(yàn)室
華為星辰聯(lián)合創(chuàng)新實(shí)驗(yàn)室揭牌成立
思必馳聲音轉(zhuǎn)換算法通過國(guó)家備案
思必馳與上海交大聯(lián)合實(shí)驗(yàn)室研究成果入選兩大頂級(jí)會(huì)議
格靈深瞳六篇論文入選ICCV 2025
思必馳與上海交大聯(lián)合實(shí)驗(yàn)室兩篇論文入選ICML 2025
思必馳AI辦公本亮相京東直播間
思必馳技術(shù)創(chuàng)新加速AI產(chǎn)業(yè)化落地
思必馳與上海交大聯(lián)合實(shí)驗(yàn)室12篇論文被ICASSP 2025收錄

思必馳與上海交大聯(lián)合實(shí)驗(yàn)室五篇論文入選NeurIPS 2025
評(píng)論