本帖最后由 NAO語(yǔ)音外包 于 2017-6-28 09:19 編輯
現(xiàn)在亞馬遜Echo音箱很火爆,根據(jù)調(diào)研結(jié)果,可以在機(jī)器人上,嵌入式板上集成語(yǔ)音功能,包含了語(yǔ)音喚醒,語(yǔ)音識(shí)別,語(yǔ)義
2017-06-28 09:13:45
本帖最后由 ouqiyuan 于 2012-5-30 10:04 編輯
是用插進(jìn)電腦的麥克風(fēng)收集
說(shuō)話(huà)人的聲音,然后辨別
說(shuō)話(huà)人(該人聲音已經(jīng)儲(chǔ)存好)的身份。{:soso_e101:},主要是
識(shí)別的部分我不會(huì)做,求各位大神指導(dǎo)或給些相關(guān)的資料和程序。我QQ是356535107,可以加我教教我?。?/div>
2012-05-30 10:01:21
求matlab特定人語(yǔ)音識(shí)別的程序,或者思路也行
2012-03-31 15:03:58
特定人語(yǔ)音識(shí)別的方法有哪些?特定人語(yǔ)音識(shí)別技術(shù)在汽車(chē)控制上的應(yīng)用是什么?
2021-05-14 06:34:04
,并且識(shí)別率低。或者是基于
DSP+RAM+Flash+加密芯片的方式,由DSP運(yùn)行存儲(chǔ)在Flash中的軟件來(lái)實(shí)現(xiàn)語(yǔ)音識(shí)別功能。這樣的模塊由于是由多個(gè)芯片和PCB組成,成本
高,外圍電路復(fù)雜,二次開(kāi)發(fā)
2009-12-16 11:59:08
引言
離線(xiàn)語(yǔ)音識(shí)別是指在沒(méi)有網(wǎng)絡(luò)連接的情況下,通過(guò)在本地設(shè)備上進(jìn)行語(yǔ)音信號(hào)處理和識(shí)別,實(shí)現(xiàn)語(yǔ)音命令的轉(zhuǎn)化和執(zhí)行。隨著智能設(shè)備的普及,離線(xiàn)語(yǔ)音識(shí)別技術(shù)在智能客服、電話(huà)會(huì)議、智能交通等領(lǐng)域
2023-11-07 18:01:32
串口調(diào)試助手測(cè)試語(yǔ)音識(shí)別效果這款語(yǔ)音識(shí)別模塊通過(guò)ESP32連接百度云語(yǔ)音識(shí)別平臺(tái)來(lái)實(shí)現(xiàn)非特定指令的語(yǔ)音識(shí)別功能,他可以把您說(shuō)的話(huà)轉(zhuǎn)換成文字通過(guò)UART接口返回??梢允褂肬SB-TTL連接電腦調(diào)試助手
2021-08-24 15:03:47
自動(dòng)語(yǔ)音識(shí)別的原理是什么?如何利用WaveNet實(shí)現(xiàn)自動(dòng)語(yǔ)音識(shí)別?
2021-06-15 09:14:07
在我的想象中機(jī)器人首先應(yīng)該能自由的走來(lái)走去,然后應(yīng)該能流利的與主人對(duì)話(huà)。朝著這個(gè)理想,我準(zhǔn)備設(shè)計(jì)一個(gè)能自由行走,并且可以與人語(yǔ)音對(duì)話(huà)的機(jī)器人。實(shí)現(xiàn)的關(guān)鍵是讓機(jī)器人能通過(guò)傳感器感知周?chē)h(huán)境,并通過(guò)
2021-12-17 06:58:27
,并且可以與人語(yǔ)音對(duì)話(huà)的機(jī)器人。實(shí)現(xiàn)的關(guān)鍵是讓機(jī)器人能通過(guò)傳感器感知周?chē)h(huán)境,并通過(guò)機(jī)器人大腦處理并輸...
2021-12-16 07:27:15
一個(gè)人們最為關(guān)心的問(wèn)題大概就是,電銷(xiāo)機(jī)器人如何做到語(yǔ)音識(shí)別,通俗來(lái)講,就是電銷(xiāo)機(jī)器人如何“聽(tīng)懂”人們說(shuō)話(huà)?其實(shí)語(yǔ)音識(shí)別技術(shù)是人工智能的一項(xiàng)基礎(chǔ)研究,但同時(shí)也是多年來(lái)一直橫亙?cè)谘芯空呙媲暗囊淮箅y關(guān),而不光
2018-06-12 14:03:56
檢索是目前急需解決的一個(gè)難題。音頻信息中主要包含語(yǔ)音、音樂(lè)、說(shuō)話(huà)人、語(yǔ)種等內(nèi)容信息。相應(yīng)的音頻識(shí)別技術(shù)主要包含以下幾類(lèi):語(yǔ)音識(shí)別技術(shù)、說(shuō)話(huà)人識(shí)別技術(shù)、語(yǔ)種識(shí)別技術(shù)、音樂(lè)識(shí)別檢索技術(shù)。語(yǔ)音識(shí)別技術(shù)可以將
2011-03-05 22:53:09
在人機(jī)語(yǔ)音交互系統(tǒng)中,機(jī)器不僅要具有理解人類(lèi)語(yǔ)音的能力,還應(yīng)當(dāng)具有識(shí)別說(shuō)話(huà)人情感的能力。本文提出了基于高斯混合模型(GMM)的序列分類(lèi)和識(shí)別的改進(jìn)方法,并將該方法引入
2009-06-03 08:14:37
23 本文在TMS320C6701EVM 板的基礎(chǔ)上實(shí)現(xiàn)一種快速的說(shuō)話(huà)人識(shí)別系統(tǒng)。本文提出一種基于段級(jí)語(yǔ)音特征的說(shuō)話(huà)人識(shí)別的快速算法,該算法在傳統(tǒng)的GMM 算法的基礎(chǔ)上使用段級(jí)語(yǔ)音特征對(duì)測(cè)試
2009-07-30 15:53:36
17 說(shuō)話(huà)人識(shí)別算法研究及
2009-08-15 10:22:18
15 DNA序列的分類(lèi)模型本文提出了DNA序列分類(lèi)的三種模型,基一,基于A,G,T,C四種堿基出現(xiàn)的頻率,其二利用了同一堿基在序列中的間隔,這一信息是單純考慮頻率所不能包含的.
2009-09-16 11:52:45
17 本文介紹了一種基于VC++開(kāi)發(fā)的井下探險(xiǎn)救援機(jī)器人語(yǔ)音通信系統(tǒng)。該系統(tǒng)采用模塊化設(shè)計(jì),能夠實(shí)現(xiàn)上位監(jiān)控機(jī)和井下機(jī)器人控制機(jī)之間的語(yǔ)音通信。實(shí)踐證明,該語(yǔ)音通信系統(tǒng)提
2010-01-25 14:03:01
20 采用機(jī)器視覺(jué)對(duì)語(yǔ)音對(duì)象進(jìn)行跟蹤,利用說(shuō)話(huà)人正常發(fā)音時(shí),嘴部的開(kāi)合狀況提取語(yǔ)速信息,實(shí)時(shí)調(diào)整語(yǔ)音識(shí)別的工作速度,匹配語(yǔ)音韻律,將有效提高語(yǔ)音識(shí)別準(zhǔn)確性。討論了系
2010-07-16 14:53:59
16 本文在TMS320C6701EVM板的基礎(chǔ)上實(shí)現(xiàn)一種快速的說(shuō)話(huà)人識(shí)別系統(tǒng)。本文提出一種基于段級(jí)語(yǔ)音特征的說(shuō)話(huà)人識(shí)別的快速算法,該算法在傳統(tǒng)的GMM算法的基礎(chǔ)上使用段級(jí)語(yǔ)音特征對(duì)測(cè)試語(yǔ)
2010-08-05 16:25:14
0 摘要! 相對(duì)解碼重建后的語(yǔ)音進(jìn)行說(shuō)話(huà)人識(shí)別從VOIP的語(yǔ)音流中直接提取語(yǔ)音特征參數(shù)進(jìn)行說(shuō)話(huà)人識(shí)別方法具有便于實(shí)現(xiàn)的優(yōu)點(diǎn)針對(duì)G.729編碼域數(shù)據(jù)# 研究基于DTW算法的快速說(shuō)話(huà)人
2010-11-22 14:59:37
0 討論了低碼率語(yǔ)音編碼MELP的編解碼過(guò)程,有效降低了語(yǔ)音編碼碼率并能使說(shuō)話(huà)者個(gè)人語(yǔ)音特征減弱,特別適合需要弱化說(shuō)話(huà)者語(yǔ)音特點(diǎn)的場(chǎng)合。給出了其FPGA的硬件實(shí)現(xiàn)框圖,據(jù)此
2010-12-01 16:57:14
33 DSP嵌入式說(shuō)話(huà)人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
0 引 言 說(shuō)話(huà)人身份識(shí)別屬于生物認(rèn)證技術(shù)的一種,是一項(xiàng)根據(jù)語(yǔ)音中反映說(shuō)話(huà)人生理和行為特征的語(yǔ)音參數(shù)來(lái)
2009-12-28 17:55:54
581 
DSP嵌入式說(shuō)話(huà)人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
0 引 言
說(shuō)話(huà)人身份識(shí)別屬于生物認(rèn)證技術(shù)的一種,是一項(xiàng)根據(jù)語(yǔ)音中反映說(shuō)話(huà)人生理和行為特征的語(yǔ)音參數(shù)來(lái)自動(dòng)
2010-01-06 14:07:54
539 
針對(duì)傳統(tǒng)基于端口和有效負(fù)載的網(wǎng)絡(luò)流量分類(lèi)算法識(shí)別率低分類(lèi)算法復(fù)雜等問(wèn)題,在分析了網(wǎng)絡(luò)流量性質(zhì)的基礎(chǔ)上提出流序列化方法。它將網(wǎng)絡(luò)流分解成多個(gè)流原子#通過(guò)提取序列化網(wǎng)絡(luò)
2011-05-16 17:29:22
23 語(yǔ)音控制的基礎(chǔ)就是語(yǔ)音識(shí)別技術(shù),可以是特定人或者非特定人的。非特定人的應(yīng)用更為廣泛,對(duì)于用戶(hù)而言不用訓(xùn)練,因此也更加方便。語(yǔ)音識(shí)別可以分為孤立詞識(shí)別,連接詞識(shí)別,
2011-07-22 10:08:48
12043 
人語(yǔ)音當(dāng)中的生物學(xué)個(gè)性特征,在特征空間建立不同個(gè)體的特征模型,從而實(shí)現(xiàn)說(shuō)話(huà)人的識(shí)別。識(shí)別的關(guān)鍵算法包括特征提取和建立模型兩個(gè)方面,參考文獻(xiàn)從基本概念到特征提取,再到模型建立,對(duì)說(shuō)話(huà)人識(shí)別中涉及的主要算法進(jìn)行了詳
2017-10-30 14:59:34
1 獲取語(yǔ)音特征,通過(guò)DTW算法實(shí)現(xiàn)語(yǔ)音特征匹配。上位機(jī)基于安卓平臺(tái),利用Android Studio工具并結(jié)合NDK組件實(shí)現(xiàn)相應(yīng)軟件與算法開(kāi)發(fā)。下位機(jī)基于Zigbee平臺(tái),利用IAR完成家居系統(tǒng)下位機(jī)的開(kāi)發(fā)。系統(tǒng)可完成特定人的語(yǔ)音控制,具有較高的識(shí)別率
2017-11-27 14:10:58
4 針對(duì)傳統(tǒng)圖轉(zhuǎn)導(dǎo)( GT)算法計(jì)算量大并且準(zhǔn)確率不高的問(wèn)題,提出一個(gè)基于C均值聚類(lèi)和圖轉(zhuǎn)導(dǎo)的半監(jiān)督分類(lèi)算法。首先,采用模糊C均值(FCM)聚類(lèi)算法先對(duì)未標(biāo)記樣本預(yù)選取,縮小圖轉(zhuǎn)導(dǎo)算法構(gòu)圖數(shù)據(jù)集的范圍
2017-11-28 16:36:12
0 針對(duì)基于固定階Markov鏈模型的方法不能充分利用不同階次子序列結(jié)構(gòu)特征的問(wèn)題,提出一種基于多階Markov模型的符號(hào)序列貝葉斯分類(lèi)新方法。首先,建立了基于多階次Markov模型的條件概率分布模型
2017-11-30 09:56:12
0 為了改善發(fā)聲力度對(duì)說(shuō)話(huà)人識(shí)別系統(tǒng)性能的影響,在訓(xùn)練語(yǔ)音存在少量耳語(yǔ)、高喊語(yǔ)音數(shù)據(jù)的前提下,提出了使用最大后驗(yàn)概率(MAP)和約束最大似然線(xiàn)性回歸(CMLLR)相結(jié)合的方法來(lái)更新說(shuō)話(huà)人模型、投影轉(zhuǎn)換
2017-12-05 15:21:06
0 語(yǔ)音識(shí)別技術(shù),也被稱(chēng)為自動(dòng)語(yǔ)音識(shí)別(ASR),其目標(biāo)是將人類(lèi)的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。與說(shuō)話(huà)人識(shí)別及說(shuō)話(huà)人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語(yǔ)音的說(shuō)話(huà)人而非其中所包含的詞匯內(nèi)容。
2018-01-02 18:36:14
16324 ,即建立說(shuō)話(huà)人語(yǔ)音特征數(shù)據(jù)庫(kù)和基追蹤匹配得到最大均值系數(shù),其中,語(yǔ)音特征向量由GMM 均值超向量核算法得到,大量實(shí)驗(yàn)數(shù)據(jù)表明,該方法定程度上提高了識(shí)別率,并且在說(shuō)話(huà)人集合較大的情況下識(shí)別效果較好。
2018-01-18 17:33:34
3 語(yǔ)音識(shí)別的意思是將人說(shuō)話(huà)的內(nèi)容和意思轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列等。與說(shuō)話(huà)人的識(shí)別不同,后者主要是識(shí)別和確認(rèn)發(fā)出語(yǔ)音的人而非其中所包含的內(nèi)容。
2018-01-31 19:31:20
3827 語(yǔ)音是復(fù)雜的非線(xiàn)性信號(hào),這使得基于線(xiàn)性理論的傳統(tǒng)說(shuō)話(huà)人識(shí)別系統(tǒng)性能難以進(jìn)一步提高。結(jié)合語(yǔ)音特點(diǎn),基于小波極大模方法(Wavelet Transform Modulus-Maxima Method
2018-12-06 15:29:56
1 當(dāng)測(cè)試語(yǔ)音時(shí)長(zhǎng)充足時(shí),單一特征的信息量和區(qū)分性足夠完成說(shuō)話(huà)人識(shí)別任務(wù),但是在測(cè)試語(yǔ)音很短的情況下,語(yǔ)音信號(hào)里缺乏充分的說(shuō)話(huà)人信息,使得說(shuō)話(huà)人識(shí)別性能急劇下降。針對(duì)短語(yǔ)音條件下的說(shuō)話(huà)人信息不足的問(wèn)題,提出一種基于多特征i-vector的短語(yǔ)音說(shuō)話(huà)人識(shí)別算法。
2018-12-14 13:42:34
6 研發(fā)出了一種簡(jiǎn)單的新型模型,該模型不僅完美地融合了聲學(xué)和語(yǔ)音線(xiàn)索,而且將說(shuō)話(huà)人分類(lèi)和語(yǔ)音識(shí)別任務(wù)融合在了同一個(gè)系統(tǒng)中。
2019-08-26 16:12:03
585 谷歌已經(jīng)展示了Euphonia項(xiàng)目,這是其AI for Social Good計(jì)劃的一項(xiàng)成果,該計(jì)劃利用人工智能來(lái)改進(jìn)語(yǔ)音識(shí)別技術(shù)。
2019-11-18 10:04:57
822 本文介紹了一種采用ARM處理器作為控制核心的非特定人語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)方案。
2020-04-11 11:17:37
1180 
斯坦福大學(xué)的一項(xiàng)研究顯示,亞馬遜、蘋(píng)果、谷歌、IBM和微軟的語(yǔ)音識(shí)別系統(tǒng)存在種族差異,對(duì)白人和黑人語(yǔ)音的識(shí)別率有高有低。
2020-05-18 09:37:31
579 從 WaveNet 到 Tacotron,再到 RNN-T,谷歌一直站在語(yǔ)音人工智能技術(shù)的最前沿。
2020-05-25 09:34:28
669 說(shuō)話(huà)人識(shí)別又稱(chēng)聲紋識(shí)別,是通過(guò)說(shuō)話(huà)人的聲音特征進(jìn)行身份認(rèn)證的一種生物特征識(shí)別技術(shù)。說(shuō)話(huà)人識(shí)別經(jīng)過(guò)60多年的研究,已經(jīng)逐步應(yīng)用到法律、銀行等各個(gè)領(lǐng)域。說(shuō)話(huà)人識(shí)別通過(guò)對(duì)語(yǔ)音信號(hào)進(jìn)行處理,提取說(shuō)話(huà)人語(yǔ)音
2020-08-06 13:17:00
673 
現(xiàn)有的說(shuō)話(huà)人識(shí)別方法仍存在許多不足?;谠?huà)語(yǔ)級(jí)特征輸入的端到端方法由于語(yǔ)音長(zhǎng)短不一致需要將輸入處理為同等大小,而特征訓(xùn)練加后驗(yàn)分類(lèi)的兩階段方法使得識(shí)別系統(tǒng)過(guò)于復(fù)雜,這些因素都會(huì)影響模型的性能。文中
2021-05-08 16:57:07
4 AI人工智能語(yǔ)音機(jī)器人不僅有真人語(yǔ)音播報(bào),還能深刻理解用戶(hù)的疑問(wèn)并給出相應(yīng)的答案,甚至對(duì)方都不知道說(shuō)話(huà)這么久的對(duì)象是機(jī)器人。智能語(yǔ)音呼出系統(tǒng)是一款人工智能語(yǔ)音機(jī)器人,語(yǔ)音機(jī)器人媲美真人語(yǔ)音的做法
2021-07-29 17:57:57
2239 語(yǔ)音識(shí)別芯片也叫語(yǔ)音識(shí)別IC,與傳統(tǒng)的語(yǔ)音芯片相比,語(yǔ)音識(shí)別芯片最大的特點(diǎn)就是能夠語(yǔ)音識(shí)別,它能讓機(jī)器聽(tīng)懂人類(lèi)的語(yǔ)音,并且可以根據(jù)命令執(zhí)行各種動(dòng)作。除此之外,語(yǔ)音識(shí)別芯片還具有高品質(zhì)、高壓縮率錄音放音功能,可實(shí)現(xiàn)人機(jī)對(duì)話(huà)。
2021-10-21 15:38:19
2346 語(yǔ)音識(shí)別智能分類(lèi)垃圾桶基本介紹器件51單片機(jī)LD3320語(yǔ)音模塊SYN6288語(yǔ)音合成SG90舵機(jī)(4個(gè))usb-ttl模塊垃圾桶四個(gè)(4個(gè))面包板(建議用)實(shí)現(xiàn)思路與接線(xiàn)實(shí)現(xiàn)流程圖接線(xiàn)呈現(xiàn)圖代碼
2021-11-12 11:21:02
60 中原始說(shuō)話(huà)人的語(yǔ)音。說(shuō)話(huà)人語(yǔ)音融合技術(shù)可用于在語(yǔ)音合成系統(tǒng)中對(duì)語(yǔ)音進(jìn)行個(gè)性化處理和生成具有特定語(yǔ)音特征的語(yǔ)音。同時(shí)允許開(kāi)發(fā)者創(chuàng)建無(wú)限數(shù)量的說(shuō)話(huà)人語(yǔ)音,合成出多樣性的語(yǔ)音,可以豐富用于訓(xùn)練自動(dòng)語(yǔ)音識(shí)別(ASR)和語(yǔ)音
2022-11-23 20:30:03
399 語(yǔ)音識(shí)別芯片也被稱(chēng)為語(yǔ)音識(shí)別IC.與傳統(tǒng)的語(yǔ)音芯片相比,語(yǔ)音識(shí)別芯片最大的特點(diǎn)是可以進(jìn)行語(yǔ)音識(shí)別,使設(shè)備能夠理解人們的語(yǔ)音,并可以根據(jù)命令執(zhí)行各種動(dòng)作.此外,語(yǔ)音識(shí)別芯片還具有高質(zhì)量,高壓縮率的音頻放音功能,可實(shí)現(xiàn)人機(jī)對(duì)話(huà).
2023-02-27 16:04:03
1010 按鍵、二進(jìn)制編碼或者字符序列。與說(shuō)話(huà)人識(shí)別及說(shuō)話(huà)人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語(yǔ)音的說(shuō)話(huà)人而非其中所包含的詞匯內(nèi)容。
2023-04-13 16:03:19
3690
評(píng)論