資料介紹
針對聲韻母相同但聲調(diào)不同的近音字識別問題和聲韻母及聲調(diào)都相同的同音字識別問題,提出在語音模型和語言模型中分別引入聲調(diào)和字轉(zhuǎn)移概率,以提高近音字和同音字的識別率。首先將聲調(diào)劃分為 5 種表現(xiàn)形式添加到漢語音節(jié)的最后一個音素中構(gòu)成新音素,使用高斯混合隱馬爾科夫模型建模新音素。然后通過統(tǒng)計方法計算特定語境下的字間轉(zhuǎn)移概率。最后使用 HTK 工具包實現(xiàn)了帶聲調(diào)的語音模型和有字轉(zhuǎn)移概率的語言模型。實驗結(jié)果證明添加聲調(diào)可以提高近音字的識別率,使用特定語境下字間轉(zhuǎn)移概率可以提高同音字的識別率。
語言是人類溝通的重要工具,語音識別是人工智能研究的重要領(lǐng)域。20 世紀(jì) 50 年代,貝爾實驗室設(shè)計了第一個語音識別系統(tǒng),實現(xiàn)了對孤立數(shù)字的語音識別[1]。20 世紀(jì) 60 年代,提出了時間歸一化打分機制、音素動態(tài)跟蹤技術(shù)和動態(tài)規(guī)劃算法,有效地解決了語音信號的特征提取和不等長語音匹配問題[2]。20 世紀(jì) 70 年代,模式識別思想、線性預(yù)測編碼等技術(shù)被應(yīng)用于語音識別中,識別對象從孤立詞轉(zhuǎn)移到連續(xù)語音[3]。20 世紀(jì) 90 年代及以后,隱馬爾科夫模型(hidden markov modol, HMM)、高 斯 混 合 模 型(gaussian mixed model, GMM)被提出[4],基于 GMM-HMM 的語音識別框架得到廣泛使用和研究,文獻(xiàn)[5]通過改進(jìn)語音特征參數(shù)相鄰幀的相關(guān)性,進(jìn)一步提高 GMM-HMM 的準(zhǔn)確度;文獻(xiàn)[6-7]使用 GMM-HMM 識別了連續(xù)語音的聲調(diào)。目前,深度學(xué)習(xí)技術(shù)也被應(yīng)用于語音處理系統(tǒng)[8-11],由于它對訓(xùn)練數(shù)據(jù)和硬件資源有著極高的要求,限制了其使用范圍?,F(xiàn)代漢語是一種有聲調(diào)的特殊語音,音素和聲調(diào)組合可以構(gòu)成無數(shù)個多音字和同音字的發(fā)音。一方面,同一個漢字在不同的聲調(diào)下代表不同的意義,另一方面,相同的讀音可能代表完全不同的漢字,因此,與印歐語系的語言相比,聲調(diào)和上下文信息對漢語語音的識別具有更重要的作用[12]。本文在語音模型中添加聲調(diào),并使用字轉(zhuǎn)移概率捕獲上下文信息,修改 HTK[13]工具包以適應(yīng)漢語語音識別問題,實驗結(jié)果證明了聲調(diào)對近音字識別的重要性,同時字轉(zhuǎn)移概率的引入能有效提高同音字識別的準(zhǔn)確率。

- 基于HMM的文本域數(shù)學(xué)表達(dá)式提取研究 0次下載
- 如何使用深度學(xué)習(xí)實現(xiàn)語音聲學(xué)模型的研究 41次下載
- 如何設(shè)計一個有限狀態(tài)轉(zhuǎn)換器的端到端中文語音識別系統(tǒng) 5次下載
- 如何進(jìn)行馬來語語音合成系統(tǒng)的設(shè)計與實現(xiàn)概述 4次下載
- 如何使用MATLAB進(jìn)行語音識別算法研究的論文資料免費下載 45次下載
- 綜合語音通信平臺的研究與實現(xiàn) 9次下載
- 基于HMM和小波神經(jīng)網(wǎng)絡(luò)混合模型的Web信息抽取_李少天 0次下載
- 基于語音特征聚類的HMM語音識別系統(tǒng)研究姚敏鋒 2次下載
- 隱馬爾可夫模型(HMM)攻略(有具體例子-方便理解) 0次下載
- 對逆合成孔徑雷達(dá)噪聲調(diào)頻預(yù)加重干擾的研究
- 噪聲調(diào)相干擾信號的性能仿真 28次下載
- 基于HMM模型的滾動軸承故障分析
- HMM及其在語音信號處理中的應(yīng)用
- 基于RS的BP-HMM在網(wǎng)絡(luò)入侵檢測中的應(yīng)用
- 基于VQ和HMM的語音識別系統(tǒng)的性能比較
- C3語音地臺ZXAIEC43 使用說明手冊 功能支持列表 943次閱讀
- Transformer模型在語音識別和語音生成中的應(yīng)用優(yōu)勢 2.6k次閱讀
- 離線語音控制技術(shù)特點 1.6k次閱讀
- 重塑翻譯與識別技術(shù):開源語音識別模型Whisper的編譯優(yōu)化與部署 5.4k次閱讀
- 基于樹莓派的電話錄音系統(tǒng)研究 899次閱讀
- 語音識別的基本概述、原理及應(yīng)用發(fā)展 1w次閱讀
- 超低噪聲調(diào)節(jié)器在寬帶通信系統(tǒng)中的應(yīng)用研究 2.6k次閱讀
- 一種基于Android平臺實現(xiàn)語音識別和命令生成 4.7k次閱讀
- 基于Tacotron實現(xiàn)StoryTime模型 3.3k次閱讀
- 基于隱馬爾可夫模型( HMM )開發(fā)了一個駕駛行為預(yù)測模型 1.1w次閱讀
- 利用語音識別技術(shù)和嵌入式系統(tǒng)交叉研究是語音識別的一個重要研究方向 1.8k次閱讀
- 互聯(lián)網(wǎng)的大腦模型與原子的太陽系模型的研究對比 5.6k次閱讀
- 語音識別技術(shù)必定會滲透在人們生活的每個角落 8.6k次閱讀
- 一種基于DSP的漢字語音識別系統(tǒng)設(shè)計 3.7k次閱讀
- GMM-HMM語音識別原理詳解 2w次閱讀
下載排行
本周
- 1MDD品牌三極管BC807數(shù)據(jù)手冊
- 3.00 MB | 次下載 | 免費
- 2MDD品牌三極管BC817數(shù)據(jù)手冊
- 2.51 MB | 次下載 | 免費
- 3MDD品牌三極管D882數(shù)據(jù)手冊
- 3.49 MB | 次下載 | 免費
- 4MDD品牌三極管MMBT2222A數(shù)據(jù)手冊
- 3.26 MB | 次下載 | 免費
- 5MDD品牌三極管MMBTA56數(shù)據(jù)手冊
- 3.09 MB | 次下載 | 免費
- 6MDD品牌三極管MMBTA92數(shù)據(jù)手冊
- 2.32 MB | 次下載 | 免費
- 7STM32G474 HRTIME PWM 丟波問題分析與解決
- 1.00 MB | 次下載 | 3 積分
- 8新能源電動汽車高壓線束的銅鋁連接解決方案
- 2.71 MB | 次下載 | 2 積分
本月
- 1愛華AIWA HS-J202維修手冊
- 3.34 MB | 37次下載 | 免費
- 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊
- 1.63 MB | 23次下載 | 免費
- 3NB-IoT芯片廠商的資料說明
- 0.31 MB | 22次下載 | 1 積分
- 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
- 0.63 MB | 6次下載 | 1 積分
- 5UWB653Pro USB口測距通信定位模塊規(guī)格書
- 838.47 KB | 5次下載 | 免費
- 6技嘉H110主板IT8628E_BX IO電路圖資料
- 2.61 MB | 4次下載 | 1 積分
- 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 8蘇泊爾DCL6909(即CHK-S009)單芯片電磁爐原理圖資料
- 0.08 MB | 2次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191439次下載 | 10 積分
- 5十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論