国产片又黄又大又不要vip,日韩国产欧美在线观看

近日, 臉書的研究人員成功克隆了微軟總裁比爾·蓋茨的聲音。

臉書人工智能研究中心的肖恩·瓦斯奎茲（Sean Vasquez）和邁克·劉易斯（Mike Lewis）于本周表示，他們已經(jīng)努力模仿人類語言有一段時間了。然而，模仿人類語言顯然是件難事，當(dāng)人們聽到斯蒂芬·霍金所使用的那套最著名的說話機(jī)器發(fā)聲時，會發(fā)現(xiàn)它聽起來仍然很不像人類。

但是現(xiàn)在，研究員們似乎已經(jīng)取得了進(jìn)展。如果你聽了蓋茨的克隆所發(fā)出的聲音，我想你是會同意的。因為它聽起來很像比爾·蓋茨，你甚至很難分辨出它和他真實聲音的區(qū)別。

研究人員展示了他們的研究。在這里，機(jī)器模仿著蓋茨的腔調(diào)發(fā)聲，“請給你珍愛的朋友發(fā)一封充滿愛意的短信。”其中最不可思議的是，這臺機(jī)器在說“珍愛（cherish）”時，準(zhǔn)確無誤地捕捉到蓋茨不斷上升的語調(diào)變化的。

這項技術(shù)被稱為MelNet，可以用來復(fù)制人類的語調(diào)。到目前為止，蓋茨和其他許多人的聲音都被它完美地再現(xiàn)了。瓦斯奎茲和劉易斯說，克隆的音頻取自各類Ted演講。

兩位研究人員還表示，直到最近，文本到語音轉(zhuǎn)換軟件還不能很好地工作的原因是它使用了波形圖記錄聲音。這些圖顯示了聲音在幾秒鐘內(nèi)的音階變化。如果你聽到過蓋茨說“珍愛”這個詞，就知道他的語氣是變化劇烈的。在試圖模仿一個人的時候，深度學(xué)習(xí)機(jī)器必須預(yù)測到所有這些細(xì)微的變化，這很不容易。

瓦斯奎茲和劉易斯說，他們通過使用一種叫做光譜圖的東西來訓(xùn)練機(jī)器，成功地克隆了聲音。

研究人員說:“光譜圖的時間軸比波形圖的時間軸緊湊幾個數(shù)量級，這意味著在波形中跨越數(shù)萬個時間步長的依賴關(guān)系在光譜圖中只跨越數(shù)百個時間步長。這使得我們的光譜圖模型能夠在數(shù)秒內(nèi)記錄各種語音和音樂樣本，并保持它們一致性?！?/p>

不過，他們也經(jīng)歷了一些挫折。研究小組表示，對他們來說，幾乎完美地復(fù)制一個句子并不難，難的是復(fù)制那些在長達(dá)幾十秒或幾分鐘的時間里，顯示了情緒變化的復(fù)雜語調(diào)”。盡管如此，當(dāng)涉及到人機(jī)交互時，研究小組說，在只涉及簡短對話的情境中，這項技術(shù)可能會帶來革命性的變化。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
91

文章
41295

瀏覽量
302669
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
67

文章
8567

瀏覽量
137241
智能語音

智能語音

+關(guān)注

關(guān)注
11

文章
829

瀏覽量
50350

原文標(biāo)題：AI精確復(fù)制聲音, 真假“比爾·蓋茨”難辨

文章出處：【微信號：smartman163，微信公眾號：網(wǎng)易智能】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

AI精確復(fù)制聲音, 真假“比爾·蓋茨”難辨

評論