chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

理論到操作實(shí)現(xiàn) 讓AI玩具機(jī)器人等智能硬件在嘈雜環(huán)境中只聽我說(shuō)話

ListenAI ? 來(lái)源:jf_40317719 ? 作者:jf_40317719 ? 2025-10-17 17:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【理論到操作實(shí)現(xiàn)】讓AI玩具機(jī)器人智能硬件在嘈雜環(huán)境中只聽我說(shuō)話

前言

本文分享的小聆AI相關(guān)的理論和聲紋技術(shù),主要是用來(lái)提升 AI 智能玩具、機(jī)器人等智能硬件在實(shí)際場(chǎng)景的語(yǔ)音交互體驗(yàn)。在用戶使用中通常會(huì)遇到這些問(wèn)題:1、身邊人交談干擾;2、用戶發(fā)音模糊;3、玩具碰撞聲、哭鬧聲等突發(fā)高頻噪聲易被聲學(xué) VAD 誤判為語(yǔ)音;4、呼吸聲、風(fēng)聲等高頻干擾導(dǎo)致語(yǔ)音失真。針對(duì)這些影響人機(jī)交互的常見問(wèn)題,小聆AI做了對(duì)應(yīng)處理,并在小程序端增加了單獨(dú)人聲慮噪的配置功能,大家按照文章中的步驟操作即可自主實(shí)現(xiàn)智能硬件對(duì)應(yīng)功能。下方視頻為實(shí)際人機(jī)交互場(chǎng)景中的率噪效果。

https://docs2.listenai.com/z/233.mp4

單獨(dú)人聲慮噪的實(shí)現(xiàn)理論

為保證AI玩具機(jī)器人等智能硬件在嘈雜環(huán)境中只聽“我”說(shuō)話的效果,從以下幾點(diǎn)進(jìn)行了優(yōu)化:

1、 語(yǔ)音VAD優(yōu)化:消除非人聲噪聲,不響應(yīng)常見家居噪聲(如風(fēng)扇、電視等)

2、 聲紋過(guò)濾:對(duì)人聲進(jìn)行聲紋對(duì)比,只保留指定聲紋的音頻

3、 語(yǔ)義VAD噪聲過(guò)濾:分析上下文語(yǔ)義,用戶附和時(shí)不打斷播報(bào),用戶猶豫、停頓延長(zhǎng)拾音時(shí)間

實(shí)現(xiàn)步驟

1、 準(zhǔn)備一個(gè)語(yǔ)音交互硬件,可以是CSK6大模型開發(fā)板、聆思Arcs mini大模型MCP開發(fā)板、也可以是ESP32語(yǔ)音模組

2、 打開“小聆AI”小程序,點(diǎn)擊添加設(shè)備,選擇對(duì)應(yīng)硬件按提示操作即可完成綁定進(jìn)行配置 (ESP32的開發(fā)板可以選擇【開源套件】)

3、 綁定成功后,進(jìn)入【語(yǔ)音識(shí)別配置】→【識(shí)別模式】→ 【僅識(shí)別已注冊(cè)聲紋的用戶】

識(shí)別默認(rèn)默認(rèn)為【所有人】

識(shí)別已注冊(cè)聲紋的用戶:在連續(xù)交互模式下,僅識(shí)別已注冊(cè)聲紋的用戶語(yǔ)音,如果只想讓AI語(yǔ)音只回復(fù)指定人可以選擇這項(xiàng)

識(shí)別喚醒設(shè)備的用戶:在連續(xù)交互模式下,僅支持喚醒設(shè)備的用戶繼續(xù)交互,其余人的語(yǔ)音將不會(huì)被識(shí)別 (可以理解為AI語(yǔ)音只回復(fù)用名字叫醒它的那個(gè)人)

4、 點(diǎn)擊【確認(rèn)】后,進(jìn)入聲紋注冊(cè)頁(yè)面,點(diǎn)擊【開始錄音】,按文本讀完后點(diǎn)擊創(chuàng)建即可。

5、 聲紋創(chuàng)建成功后會(huì)進(jìn)入聲紋對(duì)應(yīng)的【編輯畫像】界面,這個(gè)頁(yè)面可以手動(dòng)填入聲紋主人的興趣愛好、需要AI長(zhǎng)期記憶的內(nèi)容。

畫像編輯完成后返回【識(shí)別模式】界面,選擇【僅識(shí)別已注冊(cè)聲紋的用戶】即可實(shí)現(xiàn)視頻中的效果。

小聆AI語(yǔ)音交互的更多資料和玩法實(shí)現(xiàn)參考

小聆AI詳細(xì)配置參考:https://docs2.listenai.com/x/S_TEd8h7C

零代碼克隆原神可莉?qū)崿F(xiàn)桌面陪伴參考: https://docs2.listenai.com/x/x7CVdoQI3

更多個(gè)性配置方法可以參考官方開發(fā)文檔:https://docs2.listenai.com/x/S_TEd8h7C

CSK6大模型開發(fā)板的硬件資料:https://docs2.listenai.com/x/nTn9kMMCU

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39126

    瀏覽量

    299780
  • 聲紋
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    4531
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3586

    瀏覽量

    5080
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    探索RISC-V機(jī)器人領(lǐng)域的潛力

    應(yīng)用,特別是機(jī)器人操作系統(tǒng)領(lǐng)域的可行性。MUSE Pi Pro以其強(qiáng)大的K1 AI CPU和官方對(duì)主流開源軟件棧的積極適配,成為了一個(gè)非常有吸引力的選擇。 二、 硬件初窺:性能小鋼炮
    發(fā)表于 12-03 14:40

    高精度機(jī)器人控制的核心——基于 MYD-LT536 開發(fā)板的精密運(yùn)動(dòng)控制方案

    算法與 C++ 實(shí)時(shí)模塊開發(fā); - 可作為控制核心部署高精度測(cè)量機(jī)器人、激光切割機(jī)械臂、協(xié)作機(jī)械臂、AGV導(dǎo)航車系統(tǒng); - 具備機(jī)器人
    發(fā)表于 11-14 15:48

    RK3576機(jī)器人核心:三屏異顯+八路攝像頭,重塑機(jī)器人交互與感知

    機(jī)器人· 應(yīng)用領(lǐng)域:迎賓機(jī)器人、養(yǎng)老機(jī)器人、導(dǎo)覽機(jī)器人· 多攝像頭輸入:同時(shí)實(shí)現(xiàn)人臉識(shí)別(迎賓)、跌倒檢測(cè)(養(yǎng)老)、自主導(dǎo)航避障(導(dǎo)覽)
    發(fā)表于 10-29 16:41

    小蘿卜機(jī)器人的故事

    經(jīng)過(guò)我的申請(qǐng), 馬老師發(fā)放了, 小蘿卜機(jī)器人的, 開發(fā)權(quán)限, 原來(lái)的小蘿卜公司, 因?yàn)榻?jīng)營(yíng)不善倒閉, 作為科研產(chǎn)品, 幾個(gè)技術(shù)對(duì)此惋惜, 自掏腰包, 要讓小蘿卜機(jī)器人, 再生, 每次聽到小蘿卜說(shuō)
    發(fā)表于 10-23 05:24

    再掀語(yǔ)音交互革命,廣和通AI解決方案加速機(jī)器人聽覺進(jìn)化

    機(jī)器人世界里,感知是智能化的第一步,是機(jī)器人獲取環(huán)境信息,學(xué)習(xí)適應(yīng)并自主決策的前提。聽覺作為五感之一,深度融合
    的頭像 發(fā)表于 08-26 17:44 ?787次閱讀

    機(jī)器人競(jìng)技幕后:磁傳感器芯片激活 “精準(zhǔn)感知力”

    2025 世界人形機(jī)器人運(yùn)動(dòng)會(huì)于 8 月 17 日?qǐng)A滿收官,賽場(chǎng)上機(jī)器人在跑步、跳躍、抓取項(xiàng)目中的精彩表現(xiàn),背后是運(yùn)動(dòng)控制、環(huán)境感知技術(shù)
    發(fā)表于 08-26 10:02

    工業(yè)機(jī)器人的特點(diǎn)

    的基礎(chǔ),也是三者的實(shí)現(xiàn)終端,智能制造裝備產(chǎn)業(yè)包括高檔數(shù)控機(jī)床、工業(yè)機(jī)器人、自動(dòng)化成套生產(chǎn)線、精密儀器儀表、智能傳感器、汽車自動(dòng)化焊接線、柔性自動(dòng)化生產(chǎn)線、
    發(fā)表于 07-26 11:22

    具身智能硬件真正“活”起來(lái) 商湯科技機(jī)器人會(huì)說(shuō)話,需要幾步?

    交互能力! 第一步:打開機(jī)器人,連接機(jī)器人; 第二步:機(jī)器人系統(tǒng),解壓“日日新V6軟件包”,運(yùn)行配置界面,配置API KEY并點(diǎn)擊開始,
    的頭像 發(fā)表于 06-06 14:25 ?1298次閱讀

    詳細(xì)介紹機(jī)場(chǎng)智能指路機(jī)器人的工作原理

    帶)定位、Wi - Fi 定位。藍(lán)牙定位可以通過(guò)與機(jī)場(chǎng)內(nèi)部署的藍(lán)牙信標(biāo)進(jìn)行通信,獲取機(jī)器人的大致位置信息。UWB 定位則利用超寬帶信號(hào)實(shí)現(xiàn)更精確的定位,能夠復(fù)雜的室內(nèi)
    發(fā)表于 05-10 18:26

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    : 一、機(jī)器人視覺:從理論到實(shí)踐 第7章詳細(xì)介紹了ROS2機(jī)器視覺領(lǐng)域的應(yīng)用,涵蓋了相機(jī)標(biāo)定、OpenCV集成、視覺巡線、二維碼識(shí)別以及深度學(xué)習(xí)目標(biāo)檢測(cè)
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+內(nèi)容初識(shí)

    機(jī)器人技術(shù)的飛速發(fā)展,ROS 2 作為其核心工具之一,為開發(fā)者提供了強(qiáng)大的支持。與傳統(tǒng)的理論書籍不同,本書深入淺出地講解了 ROS 2 的架構(gòu)、開發(fā)流程以及智能
    發(fā)表于 04-27 11:24

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    識(shí)別聯(lián)調(diào)。 進(jìn)迭時(shí)空致力于為智能機(jī)器人提供完整全棧優(yōu)化的RISC-V AI硬件解決方案,第一代RISC-V AI CPU芯片K1已完成
    發(fā)表于 04-25 17:59

    啟明智顯AI服務(wù)機(jī)器人解決方案:智能硬件方案的佼佼者

    啟明智顯AI服務(wù)機(jī)器人解決方案,以多模態(tài)感知+全棧AI能力,打造真正“會(huì)思考、能辦事”的服務(wù)伙伴,機(jī)器人在家用與商用場(chǎng)景
    的頭像 發(fā)表于 03-11 17:15 ?1187次閱讀
    啟明智顯<b class='flag-5'>AI</b>服務(wù)<b class='flag-5'>機(jī)器人</b>解決方案:<b class='flag-5'>智能</b><b class='flag-5'>硬件</b>方案的佼佼者

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.58】ROS 2智能機(jī)器人開發(fā)實(shí)踐

    機(jī)器人、家用娛樂機(jī)器人,大到智能駕駛汽車、人形機(jī)器人,都是未來(lái)會(huì)并存的機(jī)器人形態(tài)。 不過(guò),當(dāng)年遵循“提高
    發(fā)表于 03-03 14:18

    芯訊通SIM8918模組AI玩具的應(yīng)用

    隨著生成式AI大模型的迅速崛起,AI的應(yīng)用也越來(lái)越多樣化,從智能手機(jī)到智能家居,再到一只能夠與人互動(dòng)和感知用戶情緒的
    的頭像 發(fā)表于 03-01 09:35 ?1594次閱讀