資料介紹
語音合成又稱文語轉(zhuǎn)換(Text-To-Speech),簡稱TTS,指通過機(jī)械的、電子的方法生成語音的技術(shù)。
隨著科技的發(fā)展,合成語音的自然度和音質(zhì)均得到了明顯的改善。目前,語音合成技術(shù)在我們生活中具有廣泛的應(yīng)用,如電子閱讀、車載語音導(dǎo)航、銀行醫(yī)院排號系統(tǒng)、交通播報等等,這些應(yīng)用場景都離不開語音合成。
簡單來說語音合成分為文本分析、韻律分析和聲學(xué)分析三個部分。通過文本分析提取出文本特征,在此基礎(chǔ)上預(yù)測基頻、時長、節(jié)奏等多種韻律特征,然后通過聲學(xué)模型實現(xiàn)從前端參數(shù)到語音參數(shù)的映射,最后通過聲碼器合成語音。整個過程類似于“編碼、信息匹配,解碼的過程”。
一種是參數(shù)語音合成,另一種則是拼接合成。波形拼接語音合成的過程更容易理解,即在語料庫中抽取合適的拼接單元,拼接成為句子。參數(shù)語音合成則需要對音庫進(jìn)行參數(shù)化建模,根據(jù)訓(xùn)練得到的模型預(yù)測出韻律參數(shù)和聲學(xué)參數(shù)。
波形拼接語音合成需要對錄音人進(jìn)行長達(dá)幾十個小時以上的錄音采集,而參數(shù)語音合成則只需要十個小時的錄音采集,即可完成一套定制化語音包的制作 。在體驗效果上,拼接拼接合成的語音更加貼近真實發(fā)音,但是通過參數(shù)合成的語音更穩(wěn)定。
如何讓機(jī)器說話更自然,有情感
從合成的發(fā)展歷史來看,表現(xiàn)力、音質(zhì)、復(fù)雜度和自然度一直是合成技術(shù)所追求的四點(diǎn)。但是目前水平下的合成語音很難體現(xiàn)出情感特征,例如在韻律表現(xiàn)上不夠靈活,聲調(diào)變化上相對死板。
讓機(jī)器擁有自然、有情感、高表現(xiàn)力的聲音,依舊是語音合成技術(shù)的一大難點(diǎn)。
擺脫平鋪直敘,使合成語言更具有表現(xiàn)力高立足于以下條件:
1.情感豐富的大數(shù)據(jù),如:更自然的發(fā)音、更豐富的情感、更高更強(qiáng)的表現(xiàn)力
2.新技術(shù)的應(yīng)用
(1)深度神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)成功應(yīng)用到韻律模型、聲學(xué)模型預(yù)測,并集成端到端的語音合成模型;
(2)彈性單元挑選技術(shù),讓合成語音更逼近真人發(fā)音;
?。?)立足于大量數(shù)據(jù)的文本分析技術(shù)讓合成系統(tǒng)更理解人類的語言;
3.強(qiáng)需求應(yīng)用場景,如:語音導(dǎo)航、小說播報、個性化需求等
語音合成技術(shù)已全面支持多方言、多語種、多音色的選擇,專業(yè)MOS評分可達(dá)4.0以上,為用戶提供渾厚男聲、甜美女聲,并可根據(jù)用戶需求實現(xiàn)音庫定制,滿足用戶的個性化應(yīng)用,例如:明星聲音定制、童聲定制、方言定制等。 從兩個角度來說,一。 音色的定制化,需要跟蹤錄大量的音庫,重新訓(xùn)練一個模型;二。 個性化表示方法的定制化,可以錄一些數(shù)據(jù),通過深度學(xué)習(xí)訓(xùn)練模型,自適應(yīng)的方法來實現(xiàn)。
- SYN8086語音合成芯片最全手冊 5次下載
- 語音播報功能的實現(xiàn)
- 手機(jī)里的基帶和射頻到底是干什么用的?資料下載
- 表面電阻測試儀是干什么的?資料下載
- 特殊電阻可以干什么?資料下載
- 靜電棒是干什么的?資料下載
- 使用神經(jīng)網(wǎng)絡(luò)實現(xiàn)語音驅(qū)動發(fā)音器官運(yùn)動合成方法詳細(xì)資料說明 15次下載
- 科大訊飛如何SDK導(dǎo)入和進(jìn)行語音合成移植的詳細(xì)資料說明 1次下載
- SYN6658中文語音合成芯片用戶手冊免費(fèi)下載 37次下載
- 如何進(jìn)行馬來語語音合成系統(tǒng)的設(shè)計與實現(xiàn)概述 4次下載
- 如何使用多特征i-vector進(jìn)行短語音說話人識別算法說明 6次下載
- 自然語音——智能時代的入口 3次下載
- 語音合成工具下載 3次下載
- 語音合成技術(shù)在智能機(jī)器人中的應(yīng)用 8次下載
- 基于短信和語音合成的報警接口設(shè)計
- 知道壓敏電阻能干什么? 849次閱讀
- 什么是阻焊,阻焊的目的是干什么 7535次閱讀
- 教你如何利用傅里葉變換干漂亮的事 2265次閱讀
- 轉(zhuǎn)換器是干什么用的 2.3w次閱讀
- 基于中文語音合成模塊XF-S4240實現(xiàn)語音車載終端的設(shè)計 3946次閱讀
- dfrobot語音合成模塊介紹 3378次閱讀
- 廢舊pcb回收能干什么 5179次閱讀
- 淺談?chuàng)Q熱器是什么/能干什么 1.7w次閱讀
- 蘋果Siri深度學(xué)習(xí)語音合成技術(shù)揭秘 3417次閱讀
- 車聯(lián)網(wǎng)項目是合法的嗎_車聯(lián)網(wǎng)到底能干什么 30w次閱讀
- 一種神經(jīng)語音克隆系統(tǒng)兩種方法在自然性和相似性方面表現(xiàn)良好 6109次閱讀
- 平波電抗器是干什么用的_平波電抗器計算公式 1.6w次閱讀
- 詳細(xì)解析WORLD語音合成系統(tǒng)的原理以及使用方法 1.6w次閱讀
- arduino是什么以及arduino能干什么 4.5w次閱讀
- 基于數(shù)字信號處理器的中文語音合成系統(tǒng)設(shè)計 2017次閱讀
下載排行
本周
- 1FS313B USB 的 PD和QC 快充協(xié)議電壓誘騙控制器規(guī)格書
- 2.61 MB | 3次下載 | 免費(fèi)
- 2DDR3 SDRAM參考設(shè)計手冊
- 2.84 MB | 1次下載 | 免費(fèi)
- 3FS312B USB的PD和OC快充協(xié)議電壓誘騙控制器規(guī)格書
- 1.35 MB | 1次下載 | 免費(fèi)
- 4SIP協(xié)議和私有協(xié)議廣播區(qū)別
- 1.28 MB | 1次下載 | 免費(fèi)
- 5RS2J SMA快恢復(fù)二極管規(guī)格書
- 0.50 MB | 次下載 | 免費(fèi)
- 6RS1K SMA快恢復(fù)二極管規(guī)格書
- 0.38 MB | 次下載 | 免費(fèi)
- 7FS5282 5V升壓充電兩串鋰電池充電管理IC規(guī)格書
- 6.49 MB | 次下載 | 免費(fèi)
- 8VCS2383S二維低功耗磁開關(guān)系列技術(shù)手冊
- 4.43 MB | 次下載 | 免費(fèi)
本月
- 1PFC電路與BOOST電路設(shè)計實例分享
- 1.83 MB | 18次下載 | 4 積分
- 2電源測試報告-基于 國民技術(shù) N32L406 和杰華特 JW3376+3330 的 BMS 方案
- 6.47 MB | 17次下載 | 免費(fèi)
- 3美的TM-S1-07E-B電路圖資料
- 2.05 MB | 13次下載 | 免費(fèi)
- 4世平基于靈動微 SPIN560C 的低壓無刷電機(jī)應(yīng)用方案
- 10.93 MB | 11次下載 | 免費(fèi)
- 5HAL9303線性霍爾效應(yīng)傳感器技術(shù)手冊
- 0.70 MB | 11次下載 | 免費(fèi)
- 6電流檢測芯片F(xiàn)P135應(yīng)用說明
- 1.24 MB | 10次下載 | 免費(fèi)
- 7美的tm-s1-09b主板圖紙資料
- 0.38 MB | 9次下載 | 免費(fèi)
- 8美的超薄電磁爐圖紙資料
- 0.38 MB | 6次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935134次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191424次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183352次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81601次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73818次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App






創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論