從“屏幕幻象”到“物理實(shí)體”,智能體正在重塑生產(chǎn)力的邊界!
當(dāng)大模型的敘事邏輯從“參數(shù)競(jìng)賽”轉(zhuǎn)向“應(yīng)用落地”,智能體從只會(huì)紙上談兵的“賽博玩具”,進(jìn)化為真正下地干活的“生產(chǎn)工具”。感知、聲音、圖像、動(dòng)作——這些被視為“輔助功能”的維度,成為智能體深入業(yè)務(wù)流程、實(shí)現(xiàn)規(guī)?;涞氐摹叭雸?chǎng)券”。
1月26日,星辰智能體平臺(tái)升級(jí)發(fā)布,讓智能體跨出屏幕,擁有“感知物理世界、理解復(fù)雜上下文、甚至像真人一樣多模態(tài)溝通”的能力。整合“語(yǔ)音、視覺(jué)、運(yùn)動(dòng)與執(zhí)行”的多模交互全棧方案,讓智能體從“單點(diǎn)工具”,正式升級(jí)為具備“五官、手腳與個(gè)性”的「數(shù)字合伙人」。
01讓智能體走出屏幕
成為物理世界的得力助手
從智能音箱到企業(yè)客服,語(yǔ)音無(wú)疑是AI進(jìn)入真實(shí)世界的關(guān)鍵入口。然而,將復(fù)雜的 Agent 接入語(yǔ)音鏈路并非易事——響應(yīng)延遲、語(yǔ)義割裂、系統(tǒng)狀態(tài)不同步,已是行業(yè)普遍痛點(diǎn)。涉及硬件運(yùn)動(dòng)控制時(shí),往往還需并行對(duì)接多套接口,研發(fā)周期動(dòng)輒以月為單位。
本次發(fā)布會(huì)上,星辰智能體平臺(tái)和AIUI平臺(tái)實(shí)現(xiàn)完全打通,讓Agent一鍵接入語(yǔ)音交互,在AIUI“聽(tīng)懂指令、理解意圖、執(zhí)行動(dòng)作、語(yǔ)音反饋”基礎(chǔ)之上,結(jié)合智能體讓交互更個(gè)性化,支持多模態(tài)感知和輸出。事實(shí)上,這意味著:
·場(chǎng)景打通:智能體能夠極速接入機(jī)器人、智能穿戴與各類(lèi)智能硬件,實(shí)現(xiàn)工業(yè)、家庭與消費(fèi)等場(chǎng)景落地。
·降本增效:通過(guò)更低的人力與時(shí)間成本,實(shí)現(xiàn)交互效率和效果的雙重提升。
桌面硬件機(jī)器人“小飛”現(xiàn)場(chǎng)展示了融合所帶來(lái)的進(jìn)化,當(dāng)主持人說(shuō):“小飛,你看看我們發(fā)布會(huì)現(xiàn)場(chǎng)感覺(jué)怎么樣?”。小飛準(zhǔn)確識(shí)別指令,自主移動(dòng)并環(huán)顧四周,調(diào)用視覺(jué)能力并回復(fù):“我看到一個(gè)有柔和的燈光,還有好多正在關(guān)注我們的朋友”。
對(duì)于孩子難以理解古詩(shī)的場(chǎng)景,小飛也能輕松應(yīng)對(duì),可以調(diào)用繪本智能體,將詩(shī)句轉(zhuǎn)化為圖文和聲音結(jié)合的繪本,幫助孩子輕松學(xué)、快樂(lè)學(xué)。依托于訊飛AIUI 1.6s的秒極速響應(yīng),讓用戶(hù)幾乎感覺(jué)不到卡頓,像真人聊天一樣流暢,實(shí)現(xiàn)了人類(lèi)對(duì)話中的精髓——“有來(lái)有往”。
02定義智能體的形象與聲音
多模態(tài)交互 懂你更智能
相較于千篇一律的文本/語(yǔ)音交互,用戶(hù)更喜愛(ài)有“溫度”的交互對(duì)象。智能體要走向真實(shí)世界,不僅要在復(fù)雜環(huán)境中被聽(tīng)見(jiàn)、被看見(jiàn)、被理解,并與人自然互動(dòng),還需要一個(gè)“五官”。
本次發(fā)布會(huì)上,全新升級(jí)多模態(tài)超擬人交互技術(shù),融合語(yǔ)音、人臉、環(huán)境等多模態(tài)信息,實(shí)現(xiàn)多人高噪場(chǎng)景下的自由交互,讓智能體得以搭載上豐富的聲音和形象,進(jìn)行更具象的情感表達(dá)。
聲音層面,超擬人合成在語(yǔ)音合成大模型底座升級(jí)賦能下實(shí)現(xiàn)提升,在自然度、情感表達(dá)、節(jié)奏停頓等維度和細(xì)節(jié)上表現(xiàn)更好,尤其在多輪交互中的效果顯著提升,具備“更快響應(yīng)、更懂情緒、更加靈活、更加百變”四大特點(diǎn),能像真人聊天一樣和我們“交心”。同時(shí)一句話復(fù)刻能力,也在支持的語(yǔ)種、方言以及多風(fēng)格表達(dá)上有了進(jìn)一步的突破,交互的底層聲音表達(dá)上更加擬人、多元。
形象層面,僅需一張照片就能生成專(zhuān)屬的數(shù)字人形象,口型、表情、動(dòng)作均由大模型自動(dòng)生成,可以自動(dòng)匹配文本的意圖,進(jìn)一步降低數(shù)字人的應(yīng)用門(mén)檻。多模態(tài)超擬人交互技術(shù)的升級(jí)可以幫助企業(yè),快速打造專(zhuān)屬企業(yè)數(shù)字形象代言人,塑造統(tǒng)一、生動(dòng)的品牌形象,積淀品牌資產(chǎn),實(shí)現(xiàn)品牌傳播;同時(shí),實(shí)現(xiàn)降本增效,賦能業(yè)務(wù)創(chuàng)新與全球化拓展。更重要的是,具備情感與溫度的交互方式,能夠顯著提升用戶(hù)粘性,持續(xù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)。
目前,搭載多模態(tài)超擬人交互技術(shù)的數(shù)字人已在企業(yè)服務(wù)、旅游導(dǎo)覽、陪伴學(xué)習(xí)、健康管理等多場(chǎng)景應(yīng)用,重塑服務(wù)體驗(yàn)。
在智慧大廳,數(shù)字人前臺(tái)通過(guò)多模態(tài)視覺(jué)理解,實(shí)時(shí)融合語(yǔ)音、人臉、環(huán)境等多模態(tài)信息,實(shí)現(xiàn)自動(dòng)感知與主動(dòng)迎賓。同時(shí)與多人自然交流,精準(zhǔn)識(shí)別人人對(duì)話與人機(jī)對(duì)話的意圖,并輔以生動(dòng)的手勢(shì)與類(lèi)人舉止反饋,讓每一次指引都清晰親切。
在業(yè)務(wù)終端,通過(guò)人臉識(shí)別快速認(rèn)證,數(shù)字人助手將引導(dǎo)用戶(hù)完成從查詢(xún)、填表到電子簽名的復(fù)雜業(yè)務(wù)流程,輕松自主辦結(jié)。
03智能體也有了MBTI
捏出懂你脾氣的專(zhuān)屬伙伴
“好看的形象”讓智能體擁有了辨識(shí)度,“有趣的靈魂”才是建立長(zhǎng)期陪伴與信任的關(guān)鍵。此次升級(jí),將角色性格從以往單薄的一段文案描述升級(jí)成了“可組合、可遷移”的能力模塊。
通過(guò)星辰MaaS的一句話精調(diào)模式,只需通過(guò) “性格、經(jīng)歷、技能、語(yǔ)言習(xí)慣” 幾個(gè)維度的精準(zhǔn)描述,系統(tǒng)即可生成100條場(chǎng)景數(shù)據(jù),自動(dòng)定制場(chǎng)景的角色模型,實(shí)現(xiàn)Agent交互的千人千面,除了一句話精調(diào),星辰MaaS基于高效的工具鏈+豐富的基座模型,還提供0代碼可視化精調(diào)、notebook精調(diào),滿(mǎn)足Agent各個(gè)環(huán)節(jié)的效果精調(diào),提升效果、效率的同時(shí)降低成本,助力應(yīng)用規(guī)模化增長(zhǎng)。
星辰智能體平臺(tái)還上線了音色創(chuàng)造功能——通過(guò)與語(yǔ)種、情感、風(fēng)格等屬性的聯(lián)合訓(xùn)練,實(shí)現(xiàn)了音色與風(fēng)格的任意組合。不被錄音限制,一句指令要求,即可讓智能體實(shí)現(xiàn)聲音風(fēng)格的“瞬間”切換。
假設(shè)要制作一款三國(guó)戰(zhàn)略游戲,對(duì)于精調(diào)的曹操人設(shè),現(xiàn)在能夠在不改變角色模型前提下,僅僅調(diào)整音色描述,就可以賦予其“沉穩(wěn)梟雄”或“意氣青年”的不同聲線,讓歷史人物栩栩如生。
這種能力的結(jié)合,為教育、玩具、虛擬IP等場(chǎng)景提供了更大的想象空間。在玩具、教育等長(zhǎng)期陪伴、高頻使用場(chǎng)景,用戶(hù)留下來(lái)靠的不是技能,而是像不像一個(gè)真正的伙伴。同樣,對(duì)虛擬IP來(lái)說(shuō),角色扮演性格本身就是產(chǎn)品的一部分,換一個(gè)性格就相當(dāng)于換了一種體驗(yàn)。
04讓智能體擁有“靈巧手腳”
接管重復(fù)性工作
智能體不僅要“能言善辯”,更要“躬身入局”,唯有真正接管任務(wù)才能釋放生產(chǎn)力。通過(guò)將 Agent 與 RPA 深度融合,星辰讓智能體具備了“動(dòng)手”的能力,讓聰明的大腦搭配7x24小時(shí)不知疲倦的雙手。
針對(duì)RPA需要有技術(shù)背景才能玩轉(zhuǎn),大多數(shù)卡在“搭建流程”的尷尬處境。此次發(fā)布會(huì),星辰平臺(tái)在RPA工作流編排層面帶來(lái)了兩項(xiàng)新能力——智能組件與數(shù)據(jù)表格,讓開(kāi)發(fā)者能專(zhuān)注于業(yè)務(wù)邏輯編排,而非底層代碼實(shí)現(xiàn)。
智能組件:通過(guò)自然交互即可生成“可配置、可重復(fù)執(zhí)行”自動(dòng)化組件,應(yīng)用于網(wǎng)頁(yè)自動(dòng)化和基礎(chǔ)的數(shù)據(jù)、文本處理場(chǎng)景,極大地降低自動(dòng)化能力的創(chuàng)造門(mén)檻。數(shù)據(jù)表格:用戶(hù)在流程中直接對(duì)數(shù)據(jù)進(jìn)行“讀寫(xiě)、編輯、展示和導(dǎo)出”,讓整個(gè)自動(dòng)化流程涉及到數(shù)據(jù)獲取和處理的部分變得更加透明和可調(diào)試,提升了復(fù)雜數(shù)據(jù)處理任務(wù)的可靠性和執(zhí)行效率。
發(fā)布會(huì)現(xiàn)場(chǎng),通過(guò)在RPA設(shè)計(jì)器中拖入智能組件,一句自然語(yǔ)言指令就能自動(dòng)打開(kāi)指定網(wǎng)頁(yè)、精準(zhǔn)抓取待辦事項(xiàng)的標(biāo)題、時(shí)間等關(guān)鍵信息。整個(gè)流程還支持“對(duì)話式二次編輯”,可以像修改文檔一樣通過(guò)文字微調(diào)邏輯。流程運(yùn)行后,RPA 將自動(dòng)接管瀏覽器,實(shí)現(xiàn)數(shù)據(jù)自動(dòng)化篩選與提取,將結(jié)構(gòu)化信息呈現(xiàn)在“數(shù)據(jù)表格”,實(shí)現(xiàn)從原始網(wǎng)頁(yè)到業(yè)務(wù)報(bào)表的閉環(huán)。
事實(shí)上,在整場(chǎng)發(fā)布會(huì)中,多位RPA數(shù)字員工都在高效支撐——它們活躍在電腦中,幫助主持人自動(dòng)通知演示官上場(chǎng)、回復(fù)同事信息、收取郵件設(shè)置待辦,完美展現(xiàn)了RPA的精準(zhǔn)執(zhí)行力。
05跨語(yǔ)言、懂業(yè)務(wù)的智能體
助力全球企業(yè)創(chuàng)新
在大模型時(shí)代,全球化成為企業(yè)的“共同選擇"??拼笥嶏w持續(xù)推進(jìn)全球化戰(zhàn)略,向全球開(kāi)發(fā)者開(kāi)放核心AI能力與解決方案。聚焦中東與東南亞兩大新興市場(chǎng),星辰智能體平臺(tái)將多模交互與執(zhí)行能力同步延展至海外場(chǎng)景,構(gòu)建起覆蓋多行業(yè)的海外智能體矩陣。
從數(shù)千頁(yè)基建標(biāo)書(shū)的自動(dòng)分析與比對(duì),到多語(yǔ)言混雜的實(shí)時(shí)出行引導(dǎo),再到隱藏于復(fù)雜合同中的合規(guī)風(fēng)險(xiǎn)透視,覆蓋公共服務(wù)與出行、大型基建招投標(biāo)、金融與支付等場(chǎng)景,賦能全球企業(yè)業(yè)務(wù)的創(chuàng)新升級(jí)。在提升效率、管控風(fēng)險(xiǎn)的同時(shí),為全球企業(yè)構(gòu)建起可持續(xù)的智能化競(jìng)爭(zhēng)力,打造全場(chǎng)景、全鏈路的智能新生態(tài)。
Agent的真正爆發(fā),也將始于它不再是一個(gè)需要用戶(hù)去“遷就”的對(duì)話框,而是一個(gè)能聽(tīng)懂情緒、能處理表格、能跨越國(guó)界解決復(fù)雜問(wèn)題的“貼心伙伴”。
全新升級(jí)的星辰智能體平臺(tái),補(bǔ)齊了通往物理世界的最后三塊拼圖——感知的“五官”、執(zhí)行的“手腳”以及共情的“靈魂”。 從AIUI的語(yǔ)音閉環(huán)到RPA動(dòng)作接管,從超擬人數(shù)字人的情感交互到出海場(chǎng)景的跨語(yǔ)言穿透,星辰正在構(gòu)建一套完整的“Agent 基礎(chǔ)設(shè)施”。
從“AI 技術(shù)”向“AI 原生應(yīng)用”跨越的臨界點(diǎn),唯有智能體“移出屏幕”,才能將AI深度嵌入工業(yè)生產(chǎn)、家庭陪伴、全球貿(mào)易等真實(shí)的商業(yè)毛細(xì)血管中,讓技術(shù)在最堅(jiān)硬的泥土里扎根。
當(dāng)成千上萬(wàn)個(gè)具備“執(zhí)行力”的智能體走向生產(chǎn)一線,這場(chǎng)關(guān)于效率的革命,才算真正爆發(fā)!
-
智能體
+關(guān)注
關(guān)注
1文章
445瀏覽量
11569 -
科大訊飛
+關(guān)注
關(guān)注
19文章
857瀏覽量
63498
原文標(biāo)題:星辰智能體煥新發(fā)布,多模協(xié)同的「AI實(shí)干派」
文章出處:【微信號(hào):訊飛開(kāi)放平臺(tái),微信公眾號(hào):訊飛開(kāi)放平臺(tái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
訊飛智文產(chǎn)品完成重磅升級(jí)
科大訊飛設(shè)立子公司:加碼AI與集成電路業(yè)務(wù)布局
訊飛星辰Agent平臺(tái)入選36氪WISE 2025年度焦點(diǎn)產(chǎn)品
2025科大訊飛全球1024開(kāi)發(fā)者節(jié)精彩回顧
科大訊飛發(fā)布訊飛星火X1.5及系列AI產(chǎn)品
2025科大訊飛全球1024開(kāi)發(fā)者節(jié)科博展開(kāi)幕
科大訊飛加速東南亞企業(yè)的人工智能應(yīng)用
訊飛星辰Agent開(kāi)發(fā)平臺(tái)發(fā)布
科大訊飛亮相第137屆廣交會(huì)
科大訊飛深度解析DeepSeek-V3/R1推理系統(tǒng)成本
科大訊飛星辰智能體平臺(tái)升級(jí)發(fā)布
評(píng)論