資料介紹
描述
本實(shí)驗(yàn)的目的:
在本實(shí)驗(yàn)中,我們分析了“Khule Dao”和“Bondho Koro”的真實(shí)音頻信號(hào)。之后,我們開(kāi)發(fā)了一種算法,可以自動(dòng)識(shí)別測(cè)試數(shù)據(jù)。
研究趨勢(shì):
這里簡(jiǎn)要討論最近關(guān)于孟加拉語(yǔ)語(yǔ)音識(shí)別的兩項(xiàng)研究。
在語(yǔ)音識(shí)別方面,世界各地在各種語(yǔ)言中進(jìn)行了大量的研究實(shí)驗(yàn)并取得了成果。但是,在孟加拉語(yǔ)中,該領(lǐng)域的早期研究人員取得了一定的成功,盡管近年來(lái)情況正在發(fā)生變化。本研究工作旨在開(kāi)發(fā)一種基于神經(jīng)網(wǎng)絡(luò)的孟加拉語(yǔ)連接數(shù)字識(shí)別系統(tǒng)。首先,開(kāi)發(fā)了一個(gè)由男性和女性說(shuō)話者組成的孟加拉語(yǔ)數(shù)字語(yǔ)料庫(kù)。語(yǔ)音以連接方式記錄,單詞通過(guò)自動(dòng)分割提取。然后計(jì)算分割詞的 MFCC 特征,并將這些特征值作為輸入發(fā)送到反向傳播神經(jīng)網(wǎng)絡(luò) (BPNN)。BPNN 學(xué)習(xí)算法用于訓(xùn)練網(wǎng)絡(luò)。訓(xùn)練網(wǎng)絡(luò)所需的時(shí)間、隱藏層的數(shù)量、在訓(xùn)練網(wǎng)絡(luò)以達(dá)到最佳識(shí)別精度時(shí),會(huì)考慮錯(cuò)誤閾值和時(shí)期數(shù)。這個(gè)提議的系統(tǒng)已經(jīng)使用面向?qū)ο蟮?a target='_blank' class='arckwlink_none'>編程實(shí)現(xiàn)了,所獲得的識(shí)別精度非常令人滿意和一致。該網(wǎng)絡(luò)已經(jīng)針對(duì)三種不同的設(shè)置進(jìn)行了測(cè)試,數(shù)字?jǐn)?shù)據(jù)集的最佳識(shí)別準(zhǔn)確率為 98.46%。[1]
語(yǔ)音識(shí)別是一種生物識(shí)別技術(shù),用于識(shí)別特定的個(gè)人語(yǔ)音。特定語(yǔ)音的語(yǔ)音波構(gòu)成了說(shuō)話人識(shí)別的基礎(chǔ)。我們可以在電話銀行、電話購(gòu)物、訪問(wèn)數(shù)據(jù)庫(kù)信息和語(yǔ)音郵件等多個(gè)應(yīng)用領(lǐng)域使用語(yǔ)音識(shí)別。語(yǔ)音識(shí)別的強(qiáng)大應(yīng)用之一是出于安全目的,一個(gè)人可以輸入他/她的語(yǔ)音進(jìn)行身份驗(yàn)證。每種類型的聲音都有其獨(dú)特的特征,稱為特征,從單個(gè)聲音中提取這些特征的過(guò)程稱為特征提取。將提取的語(yǔ)音特征與數(shù)據(jù)庫(kù)中已保存的語(yǔ)音進(jìn)行比較以進(jìn)行匹配。[2]
提取技術(shù):
audioread、num2str、strcat、fft、abs、最大值、長(zhǎng)度。
建議功能:
1.我們的技術(shù)特點(diǎn)是基于快速傅立葉變換(fft)的簡(jiǎn)單語(yǔ)音識(shí)別系統(tǒng)。
2.首先使用MATLAB的audioread函數(shù)分析音頻信號(hào)
對(duì)于 I = 1:116
s1 ='Z:\EEE 309\Open_Ended\Train_Data\Train_Open\OP-';
s2 = num2str(i);
s3 = '.mp3';
文件1 = strcat(s1,s2,s3);
如果存在 (file1, 'file') == [y, t] = audioread(file1);
3. 然后對(duì)所有循環(huán)中的所有信號(hào)的給定輸入數(shù)據(jù)應(yīng)用 fft
NFFT=長(zhǎng)度(y);% 找到 y 的長(zhǎng)度
x=fft(y, NFFT);
4.使用max函數(shù)求最大幅度
x1=abs(x);
F=((0:1/NFFT:1-1/NFFT)*Fs);
max_amp=max(x1);
5.使用find函數(shù)找到最大幅度的對(duì)應(yīng)頻率
b=find(x1==max_amp(1));
F_KD_max(i)=F(b(1));
6. “Khule Dao”和“Bondho Koro”的頻率值相加并取平均值
7. if(F_KD_max(i)>50 && F_KD_max(i)<600)
c1 = c1 +1;
sum1=sum1+F_KD_max(i);
結(jié)尾
average_max_frequency_of_Khule_Dao=sum1/c1
8. 我們建議,如果測(cè)試數(shù)據(jù)的頻率之差(絕對(duì)值)對(duì)應(yīng)于最大幅度,并且“Khule Dao”的平均頻率值小于測(cè)試數(shù)據(jù)的頻率與“Bondho Koro”的平均頻率之差,那么測(cè)試數(shù)據(jù)將被預(yù)測(cè)為“Khule Dao”,反之亦然“Bondho Koro”
Diff_khule_dao_max(i)= abs(F_max(i)-average_max_frequency_of_Khule_Dao);
Diff_bondo_koro_max(i)= abs(F_max(i)-average_max_frequency_of_bondo_koro);
if(Diff_bondo_koro_max(i) >= Diff_khule_dao_max(i))
disp('Khule 道')
No_of_khule_dao=No_of_khule_dao+1;
別的
disp('邦多科羅')
No_of_bondho_koro=No_of_bondho_koro+1;
?
- 自定義神經(jīng)網(wǎng)絡(luò)對(duì)象識(shí)別開(kāi)源分享
- 開(kāi)源硬件邊緣語(yǔ)音識(shí)別
- 語(yǔ)音識(shí)別芯片LD3320開(kāi)發(fā)手冊(cè) 45次下載
- NRK330X語(yǔ)音識(shí)別芯片離線語(yǔ)音喚醒模塊資料說(shuō)明書(shū)!
- 語(yǔ)音識(shí)別_ML-KWS-for-MCU_資料整理
- NRK220X語(yǔ)音識(shí)別模塊語(yǔ)音芯片語(yǔ)音ic數(shù)據(jù)資料
- 結(jié)合MFCC和特征的語(yǔ)音情感識(shí)別方法 23次下載
- 基于性能影響因素分析的語(yǔ)音識(shí)別平臺(tái)體系結(jié)構(gòu) 20次下載
- 基于改進(jìn)長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的兒童語(yǔ)音情感識(shí)別模型 14次下載
- 如何使用LVQ進(jìn)行普米語(yǔ)語(yǔ)譜圖的識(shí)別說(shuō)明 7次下載
- 如何進(jìn)行馬來(lái)語(yǔ)語(yǔ)音合成系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)概述 4次下載
- 如何使用MATLAB進(jìn)行語(yǔ)音識(shí)別算法研究的論文資料免費(fèi)下載 44次下載
- 科大訊飛5.0語(yǔ)音軟件的安裝和操作要領(lǐng)資料說(shuō)明 11次下載
- 緬甸語(yǔ)分詞方法及其實(shí)現(xiàn)方法來(lái)開(kāi)發(fā)緬甸語(yǔ)的語(yǔ)音合成系統(tǒng) 0次下載
- 云知聲語(yǔ)音識(shí)別開(kāi)發(fā)平臺(tái) 27次下載
- 自動(dòng)語(yǔ)音識(shí)別技術(shù)基本指南 2027次閱讀
- 基于JuliUS語(yǔ)音識(shí)別引擎實(shí)現(xiàn)機(jī)器人孤立詞語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì) 1809次閱讀
- dfrobot語(yǔ)音識(shí)別控制板 介紹 3202次閱讀
- firefly百度人臉識(shí)別開(kāi)發(fā)套件介紹 2333次閱讀
- 語(yǔ)音識(shí)別系統(tǒng)功能_語(yǔ)音識(shí)別系統(tǒng)的應(yīng)用 5694次閱讀
- 語(yǔ)音識(shí)別芯片的原理_語(yǔ)音識(shí)別芯片有哪些 5308次閱讀
- 一文解讀語(yǔ)音識(shí)別的運(yùn)行原理 3949次閱讀
- 語(yǔ)音識(shí)別技術(shù)的發(fā)展歷程,語(yǔ)音識(shí)別是如何工作的?語(yǔ)音識(shí)別資料概述 1w次閱讀
- 深度學(xué)習(xí)進(jìn)行語(yǔ)音識(shí)別的方法 如何建立自己的語(yǔ)音識(shí)別系統(tǒng) 1w次閱讀
- 語(yǔ)音識(shí)別技術(shù)的發(fā)展及難點(diǎn)分析 2.3w次閱讀
- 語(yǔ)音識(shí)別技術(shù)是什么_語(yǔ)音識(shí)別技術(shù)應(yīng)用領(lǐng)域介紹 1.6w次閱讀
- 語(yǔ)音識(shí)別技術(shù)原理全面解析 1.2w次閱讀
- 語(yǔ)音識(shí)別技術(shù)的應(yīng)用及發(fā)展 2346次閱讀
- 基于語(yǔ)音識(shí)別技術(shù)的聲控鼠標(biāo)光標(biāo)程序設(shè)計(jì) 5195次閱讀
- 如何關(guān)閉word語(yǔ)音識(shí)別 (數(shù)據(jù)丟失) 5179次閱讀
下載排行
本周
- 1NS1081/NS1081S/NS1081Q USB 3.0閃存數(shù)據(jù)手冊(cè)
- 0.40 MB | 4次下載 | 2 積分
- 2光伏并網(wǎng)逆變器原理
- 7.31 MB | 3次下載 | 2 積分
- 3T20電烙鐵原理圖資料
- 0.27 MB | 2次下載 | 免費(fèi)
- 4PL83081 雙路恒流同步降壓轉(zhuǎn)換器技術(shù)手冊(cè)
- 3.34 MB | 1次下載 | 免費(fèi)
- 5PL88052 4.8V至60V輸入,5A,同步降壓轉(zhuǎn)換器技術(shù)手冊(cè)
- 3.36 MB | 1次下載 | 免費(fèi)
- 6LX8201微孔霧化驅(qū)動(dòng)芯片電路圖資料
- 0.15 MB | 1次下載 | 免費(fèi)
- 7PC6200_7V直流電機(jī)驅(qū)動(dòng)器技術(shù)手冊(cè)
- 0.47 MB | 次下載 | 免費(fèi)
- 8恒溫晶體振蕩器(OCXO)FOC-2D:20.6×20.6mm在通信基站和測(cè)試設(shè)備中的應(yīng)用參數(shù)規(guī)格
- 485.75 KB | 次下載 | 免費(fèi)
本月
- 1如何看懂電子電路圖
- 12.88 MB | 329次下載 | 免費(fèi)
- 2RK3588數(shù)據(jù)手冊(cè)
- 2.24 MB | 14次下載 | 免費(fèi)
- 3PC5502負(fù)載均流控制電路數(shù)據(jù)手冊(cè)
- 1.63 MB | 12次下載 | 免費(fèi)
- 4STM32F10x參考手冊(cè)資料
- 13.64 MB | 12次下載 | 1 積分
- 5OAH0428 V1.0英文規(guī)格書(shū)
- 5.86 MB | 8次下載 | 免費(fèi)
- 6NS1081/NS1081S/NS1081Q USB 3.0閃存數(shù)據(jù)手冊(cè)
- 0.40 MB | 4次下載 | 2 積分
- 7PID控制算法學(xué)習(xí)筆記資料
- 3.43 MB | 3次下載 | 2 積分
- 8光伏并網(wǎng)逆變器原理
- 7.31 MB | 3次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935132次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191415次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183349次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81599次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73818次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65990次下載 | 10 積分
評(píng)論