近日,國際語音與語言處理領(lǐng)域頂級賽事Interspeech 2026音頻推理挑戰(zhàn)賽結(jié)果正式揭曉。在這場首次將評估焦點(diǎn)從“答案正確性”轉(zhuǎn)向“推理過程質(zhì)量”的變革性賽事中,思必馳-上海交通大學(xué)聯(lián)合實(shí)驗(yàn)室團(tuán)隊(duì)?wèi){借創(chuàng)新的多智能體協(xié)同方案,在全球眾多頂尖科研團(tuán)隊(duì)的角逐中脫穎而出,斬獲智能體賽道亞軍。
這一成績不僅彰顯了思必馳在音頻與多模態(tài)前沿領(lǐng)域的深度探索能力,更與企業(yè)近年在頂級學(xué)術(shù)會議上的密集突破、核心人才的國際認(rèn)可、以及“1+N”分布式智能體系統(tǒng)在硬件產(chǎn)品上的成功落地形成完美呼應(yīng),共同勾勒出思必馳從技術(shù)深耕到產(chǎn)業(yè)賦能的全景畫卷。
方案解碼:多智能體協(xié)同實(shí)現(xiàn) “透明化推理”
不同于傳統(tǒng)語音識別聚焦 “精準(zhǔn)轉(zhuǎn)寫” 的核心訴求,Interspeech 2026音頻推理挑戰(zhàn)賽更強(qiáng)調(diào)模型的 “認(rèn)知與解釋能力”—— 要求系統(tǒng)不僅能輸出結(jié)果,更需生成清晰的中間思維鏈,證明其真正理解音頻中的邏輯關(guān)系、物理規(guī)律及情感內(nèi)涵。這一變革性要求,恰好與思必馳 “構(gòu)建可靠性優(yōu)先的 1+N 分布式智能體系統(tǒng)” 的技術(shù)愿景高度契合。
面對復(fù)雜的音頻推理任務(wù),思必馳聯(lián)合實(shí)驗(yàn)室團(tuán)隊(duì)創(chuàng)新性地采用“跨模態(tài)轉(zhuǎn)化 + 多智能體協(xié)作”方案:先將音頻信號轉(zhuǎn)化為 Mel 頻譜圖、CQT 頻譜圖等視覺表征,借助成熟的視覺語言模型精準(zhǔn)分析頻譜結(jié)構(gòu),大幅提升數(shù)值計(jì)算與時間結(jié)構(gòu)理解類任務(wù)的推理精度;更核心的是引入多智能體投票機(jī)制與一致性路由策略,通過中樞大模型統(tǒng)籌調(diào)度 N 個垂域子智能體,從不同維度交叉驗(yàn)證結(jié)論,有效規(guī)避單一模型的決策偏差,最終在 “推理過程質(zhì)量” 這一核心評估維度獲得賽事高度認(rèn)可。
這一技術(shù)方案的成功,正是思必馳“1+N 分布式智能體系統(tǒng)”核心理念的前沿實(shí)踐 —— 通過一個中樞大模型負(fù)責(zé)全局理解與任務(wù)拆解,協(xié)同 N 個垂直領(lǐng)域模型或工具模塊精準(zhǔn)賦能,實(shí)現(xiàn)更可靠、更可解釋的復(fù)雜任務(wù)處理能力,為 AI 技術(shù)從“黑盒預(yù)測”走向“透明決策”提供了可行路徑。
學(xué)術(shù)厚積:一年內(nèi)十余篇論文入選全球頂會
此次在Interspeech 2026上的佳績,并非孤立的幸運(yùn),而是思必馳長期堅(jiān)持“產(chǎn)業(yè)需求驅(qū)動的有組織科研”模式的必然結(jié)果。作為科技部批準(zhǔn)建設(shè)的 “語言計(jì)算國家新一代人工智能開放創(chuàng)新平臺”,思必馳近年來在全球頂級學(xué)術(shù)舞臺持續(xù)發(fā)力,形成高密度、高質(zhì)量的成果輸出。
僅2025年,思必馳-上海交通大學(xué)聯(lián)合實(shí)驗(yàn)室便有 20 篇論文入選人工智能領(lǐng)域頂級會議:13篇成果同時收錄于語音領(lǐng)域旗艦會議Interspeech 2025與計(jì)算語言學(xué)頂會ACL 2025,覆蓋大模型檢索增強(qiáng)生成、低比特率語音編解碼、低延遲語音合成等關(guān)鍵方向,其中針對大模型幻覺問題的 NeuSym-RAG 框架,通過神經(jīng)與符號檢索協(xié)同,顯著提升復(fù)雜文檔問答的可靠性;2 篇論文入選機(jī)器學(xué)習(xí)頂會ICML 2025,提出的 Relign 可靠性對齊框架,首次系統(tǒng)化解決大模型 “工具幻覺” 問題,為安全調(diào)用外部工具開辟新路徑;5 篇論文亮相神經(jīng)信息處理系統(tǒng)大會NeurIPS 2025,聚焦指令微調(diào)與模型可解釋表征研究,為智能體規(guī)劃能力與魯棒性提升提供理論支撐。
一系列高密度、高質(zhì)量的學(xué)術(shù)產(chǎn)出,清晰地展示了思必馳在對話式AI核心技術(shù)領(lǐng)域的系統(tǒng)性布局和源頭創(chuàng)新能力。
人才引領(lǐng):首席科學(xué)家獲評內(nèi)地首位ISCA Fellow,搭建國際學(xué)術(shù)橋梁
學(xué)術(shù)突破的背后,是頂級人才的戰(zhàn)略引領(lǐng)。2025年8月,思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱教授被國際語音通訊協(xié)會授予ISCA Fellow榮譽(yù),成為自該協(xié)會2008年成立以來中國內(nèi)地首位獲此殊榮的學(xué)者。這一榮譽(yù)不僅是對俞凱教授在語音識別、口語對話系統(tǒng)及技術(shù)部署領(lǐng)域杰出貢獻(xiàn)的國際認(rèn)可,更是對思必馳整體科研實(shí)力的有力背書。
同年年底,俞凱教授邀請經(jīng)典著作《強(qiáng)化學(xué)習(xí)導(dǎo)論》的合著者、2024年圖靈獎得主Richard Sutton教授訪華,在上海交通大學(xué)、蘇州大學(xué)等高校開展高規(guī)格學(xué)術(shù)交流。這場“強(qiáng)化學(xué)習(xí)之父”與本土學(xué)者的深度對話,不僅推動了國內(nèi)AI前沿研究的發(fā)展,也進(jìn)一步鞏固了思必馳在強(qiáng)化學(xué)習(xí)與對話決策領(lǐng)域的理論根基。依托俞凱教授領(lǐng)銜的科研團(tuán)隊(duì),思必馳牽頭組建江蘇省語言計(jì)算及應(yīng)用重點(diǎn)實(shí)驗(yàn)室,與上海交通大學(xué)、南京大學(xué)等 16 所高校開展專項(xiàng)技術(shù)攻關(guān),構(gòu)建起 “產(chǎn)學(xué)研用” 一體化的人才培養(yǎng)與創(chuàng)新生態(tài)。
產(chǎn)品落地:多智能體理念在硬件領(lǐng)域的快速落地
前沿研究并非束之高閣,思必馳“產(chǎn)學(xué)研用”的閉環(huán)能力在其產(chǎn)品端展現(xiàn)得淋漓盡致。2025年下半年發(fā)布的AI辦公本X5系列,正是其“多智能體協(xié)作”理念在消費(fèi)級硬件上的集大成者。
X5內(nèi)置的多智能體協(xié)作專業(yè)會議大模型,構(gòu)建了“記錄-歸納-決策-執(zhí)行”的一體化工作流。它不僅能精準(zhǔn)識別會議內(nèi)容,更能通過分場景AI洞察機(jī)制,自動提取關(guān)鍵議題、生成待辦事項(xiàng),甚至給出風(fēng)險提示和行動建議。這實(shí)現(xiàn)了從被動“記錄員”到主動“決策官”的質(zhì)變,其背后的技術(shù)邏輯與在Interspeech 2026挑戰(zhàn)賽中獲獎的多智能體投票、交叉驗(yàn)證機(jī)制一脈相承。同時,X5所實(shí)現(xiàn)的端側(cè)大模型離線部署,既呼應(yīng)了學(xué)術(shù)界對模型效率與數(shù)據(jù)安全的追求,更實(shí)現(xiàn)了 “數(shù)據(jù)本地處理” 的隱私保護(hù),讓用戶在無網(wǎng)絡(luò)環(huán)境下也能享受智能辦公體驗(yàn),真正將論文中的可靠性技術(shù)轉(zhuǎn)化為手中的實(shí)用價值。
此外,思必馳在智慧辦公領(lǐng)域推出的高端矩陣麥克風(fēng)MA600D、拾擴(kuò)一體吸頂麥MCS06等產(chǎn)品,同樣凝聚了其在聲學(xué)信號處理、AI降噪等領(lǐng)域的多年學(xué)術(shù)積淀,通過AI算法重構(gòu)空間聲學(xué),重新定義了企業(yè)級的溝通體驗(yàn)。從國際賽事領(lǐng)獎臺到日常辦公場景,思必馳正通過“學(xué)術(shù)筑基-技術(shù)創(chuàng)新-產(chǎn)品賦能”的閉環(huán),讓“可靠 AI”走進(jìn)千行百業(yè)。
從國際頂級的學(xué)術(shù)講臺,到競爭激烈的賽事榜單,再到觸手可及的智能硬件,思必馳正以實(shí)際行動踐行其“構(gòu)建可靠性優(yōu)先的分布式智能體系統(tǒng)”的技術(shù)愿景。此次Interspeech 2026智能體賽道亞軍的獲得,不僅是對思必馳在音頻推理這一前沿方向上技術(shù)領(lǐng)先性的證明,更是對其過去一年在人才、學(xué)術(shù)、產(chǎn)業(yè)三維度協(xié)同并進(jìn)、厚積薄發(fā)態(tài)勢的最佳注腳。未來,思必馳將繼續(xù)秉持科研與產(chǎn)業(yè)深度融合的理念,以更可靠的對話式AI,推動更多前沿技術(shù)落地為實(shí)用產(chǎn)品,賦能辦公、座艙、家居等全場景,為產(chǎn)業(yè)高質(zhì)量發(fā)展注入創(chuàng)新動能。
-
AI
+關(guān)注
關(guān)注
91文章
39666瀏覽量
301274 -
智能體系
+關(guān)注
關(guān)注
0文章
2瀏覽量
5637 -
思必馳
+關(guān)注
關(guān)注
4文章
397瀏覽量
15977
原文標(biāo)題:Interspeech 2026 | 思必馳斬獲全球亞軍,多智能體技術(shù)引領(lǐng) “可靠AI”落地新實(shí)踐
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
思必馳亮相ISE 2026歐洲視聽技術(shù)及系統(tǒng)集成展覽會
AICAS 2026 Grand Challenge全球挑戰(zhàn)賽啟動
蘇州市委書記范波一行蒞臨思必馳調(diào)研
思必馳任務(wù)型對話算法通過國家備案
思必馳聲音轉(zhuǎn)換算法通過國家備案
思必馳一鳴智能客服大模型通過生成式人工智能服務(wù)備案
思必馳空調(diào)大模型解決方案
思必馳7月份大事件回顧
思必馳北京AI展廳升級亮相
思必馳宣布,再獲新一輪融資
傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍
思必馳斬獲Interspeech 2026音頻推理挑戰(zhàn)賽智能體賽道亞軍
評論