免费国产又色又爽又黄的视频,无码一二三区

僅需3.7秒的音頻，中國(guó)科技巨頭百度開發(fā)的一種新的AI 算法就可以克隆出一種非?？尚诺奶摷俾曇?。就像機(jī)器學(xué)習(xí)軟件的迅速發(fā)展一樣，這種軟件可以使虛擬視頻的制作民主化，這項(xiàng)研究表明為什么越來越難相信互聯(lián)網(wǎng)上的任何媒體。

這家科技巨頭的研究人員在Deep Voice發(fā)布了他們的最新進(jìn)展，Deep Voice是一個(gè)為聲音克隆開發(fā)的系統(tǒng)。一年前，該技術(shù)需要大約30分鐘的音頻來創(chuàng)建新的假音頻片段。現(xiàn)在，只需幾秒鐘的培訓(xùn)材料，它可以創(chuàng)造出更好的結(jié)果。

百度近日宣布，百度開發(fā)的新 AI 算法Deep Voice可以通過3.7秒鐘的錄音樣本數(shù)據(jù)就能完美的克隆出一個(gè)人的聲音。

Deep Voice是百度AI研究院一個(gè)由深度神經(jīng)網(wǎng)絡(luò)構(gòu)建的高質(zhì)量語音轉(zhuǎn)（TTS ）系統(tǒng)。該系統(tǒng)不僅提高的模擬的時(shí)間，百度還優(yōu)化了它出錯(cuò)的概率。甚至還在一個(gè)單GPU服務(wù)器上，把推斷規(guī)模提高到到每天1000萬次以上。

自適應(yīng)說話人編碼方法在訓(xùn)練、克隆和音頻生成中的應(yīng)用

Deep Voice最早是在2017年的年初發(fā)布了第一版，初版的系統(tǒng)就能模擬初簡(jiǎn)短的句子，而且說起話來幾乎無法區(qū)分和真人的區(qū)別。但是該系統(tǒng)一次只能模擬一個(gè)人的聲音，而且需要好幾個(gè)小時(shí)的學(xué)習(xí)才能克隆成功。但是最新發(fā)布的成功已經(jīng)縮短到3.7秒，并且能將女性聲音轉(zhuǎn)變成男性，英式聲音變成美式。

模擬器編碼器結(jié)構(gòu)

百度研究院的研究人員在預(yù)印本網(wǎng)站 arxiv 上的發(fā)表了其 Deep Voice 系統(tǒng)的最新進(jìn)展《Neural Voice Cloning with a Few Samples》。除了利用少量樣本克隆聲音外，系統(tǒng)還能將女性聲音轉(zhuǎn)變成男性，英式聲音變成美式。百度研究人員表示，這項(xiàng)研究可應(yīng)用于人機(jī)交互的個(gè)性化方面。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4838

瀏覽量
107795
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8553

瀏覽量
136956

原文標(biāo)題：只需 3.7 秒，百度最新AI算法就能克隆任何人的聲音！

文章出處：【微信號(hào)：worldofai，微信公眾號(hào)：worldofai】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

百度最新AI算法就能克隆任何人的聲音！只需 3.7 秒!

評(píng)論