chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI精確復(fù)制聲音, 真假“比爾·蓋茨”難辨

Gv1N_smartman16 ? 來源:yxw ? 2019-06-15 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日, 臉書的研究人員成功克隆了微軟總裁比爾·蓋茨的聲音。

臉書人工智能研究中心的肖恩·瓦斯奎茲(Sean Vasquez)和邁克·劉易斯(Mike Lewis)于本周表示,他們已經(jīng)努力模仿人類語言有一段時(shí)間了。然而,模仿人類語言顯然是件難事,當(dāng)人們聽到斯蒂芬·霍金所使用的那套最著名的說話機(jī)器發(fā)聲時(shí),會(huì)發(fā)現(xiàn)它聽起來仍然很不像人類。

但是現(xiàn)在,研究員們似乎已經(jīng)取得了進(jìn)展。如果你聽了蓋茨的克隆所發(fā)出的聲音,我想你是會(huì)同意的。因?yàn)樗犉饋砗芟癖葼枴どw茨,你甚至很難分辨出它和他真實(shí)聲音的區(qū)別。

研究人員展示了他們的研究。在這里,機(jī)器模仿著蓋茨的腔調(diào)發(fā)聲,“請(qǐng)給你珍愛的朋友發(fā)一封充滿愛意的短信?!逼渲凶畈豢伤甲h的是,這臺(tái)機(jī)器在說“珍愛(cherish)”時(shí),準(zhǔn)確無誤地捕捉到蓋茨不斷上升的語調(diào)變化的。

這項(xiàng)技術(shù)被稱為MelNet,可以用來復(fù)制人類的語調(diào)。到目前為止,蓋茨和其他許多人的聲音都被它完美地再現(xiàn)了。瓦斯奎茲和劉易斯說,克隆的音頻取自各類Ted演講。

兩位研究人員還表示,直到最近,文本到語音轉(zhuǎn)換軟件還不能很好地工作的原因是它使用了波形圖記錄聲音。這些圖顯示了聲音在幾秒鐘內(nèi)的音階變化。如果你聽到過蓋茨說“珍愛”這個(gè)詞,就知道他的語氣是變化劇烈的。在試圖模仿一個(gè)人的時(shí)候,深度學(xué)習(xí)機(jī)器必須預(yù)測到所有這些細(xì)微的變化,這很不容易。

瓦斯奎茲和劉易斯說,他們通過使用一種叫做光譜圖的東西來訓(xùn)練機(jī)器,成功地克隆了聲音。

研究人員說:“光譜圖的時(shí)間軸比波形圖的時(shí)間軸緊湊幾個(gè)數(shù)量級(jí),這意味著在波形中跨越數(shù)萬個(gè)時(shí)間步長的依賴關(guān)系在光譜圖中只跨越數(shù)百個(gè)時(shí)間步長。這使得我們的光譜圖模型能夠在數(shù)秒內(nèi)記錄各種語音和音樂樣本,并保持它們一致性?!?/p>

不過,他們也經(jīng)歷了一些挫折。研究小組表示,對(duì)他們來說,幾乎完美地復(fù)制一個(gè)句子并不難,難的是復(fù)制那些在長達(dá)幾十秒或幾分鐘的時(shí)間里,顯示了情緒變化的復(fù)雜語調(diào)”。盡管如此,當(dāng)涉及到人機(jī)交互時(shí),研究小組說,在只涉及簡短對(duì)話的情境中,這項(xiàng)技術(shù)可能會(huì)帶來革命性的變化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    90

    文章

    38226

    瀏覽量

    297122
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8541

    瀏覽量

    136245
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    823

    瀏覽量

    50064

原文標(biāo)題:AI精確復(fù)制聲音, 真假“比爾·蓋茨”難辨

文章出處:【微信號(hào):smartman163,微信公眾號(hào):網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    IC聲音放大芯片怎么焊接區(qū)分啊,好小感覺四面都一樣?

    想做一個(gè)簡單的基于ESP32的AI語音識(shí)別助手,焊接好的聲音輸出一直是000。
    發(fā)表于 12-09 22:08

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    釋放聲音的維度:高性能評(píng)估板為沉浸式音頻體驗(yàn)快速便捷構(gòu)建聲場工具

    A316-V71-Game-V1是一款基于XMOS XU316技術(shù)的虛擬7.1游戲聲卡評(píng)估平臺(tái),能夠?qū)⒘Ⅲw聲音頻轉(zhuǎn)換為虛擬7.1聲道環(huán)繞聲,為游戲玩家提供身臨其境的音頻體驗(yàn),幫助精確定位游戲中的聲音方向。
    的頭像 發(fā)表于 09-30 14:14 ?343次閱讀
    釋放<b class='flag-5'>聲音</b>的維度:高性能評(píng)估板為沉浸式音頻體驗(yàn)快速便捷構(gòu)建聲場工具

    如何進(jìn)行聲音定位?

    文章主要介紹了如何利用一種簡單的TDOA算法進(jìn)行聲音點(diǎn)位,并使用數(shù)據(jù)采集卡進(jìn)行聲音定位的實(shí)驗(yàn)。
    的頭像 發(fā)表于 09-23 15:47 ?1104次閱讀
    如何進(jìn)行<b class='flag-5'>聲音</b>定位?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    復(fù)制人類智能的AI---AGI。 走向AGI的五個(gè)層次發(fā)現(xiàn)階段: ①L1,聊天機(jī)器人:具備基礎(chǔ)的對(duì)話能力,能夠理解和回應(yīng)簡單的文本輸入 ②L2,推理者:具備基本的邏輯推理能力,能夠分析復(fù)雜信息并進(jìn)行推斷
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎(jiǎng)級(jí)別的假設(shè)哦。 AI驅(qū)動(dòng)科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個(gè)范式了,與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)、數(shù)據(jù)驅(qū)動(dòng)科學(xué)一起構(gòu)成
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個(gè)由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺(tái)濕潤的軟組織
    發(fā)表于 09-06 19:12

    聲源定位模塊-AR1105# 聲源定位# 聲音定位

    聲音降噪
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年08月01日 16:01:09

    正點(diǎn)原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續(xù)航,語音暢聊,情景對(duì)話,知識(shí)科普,多色可選,隨身攜帶!

    品非它莫屬! 為什么選擇小智AI? 真人級(jí)交互體驗(yàn) ① AI情感對(duì)話:不止問答,更能陪你聊心事、講笑話,像朋友一樣懂你! ② 10+音色百變:溫柔御姐、萌趣童聲、磁性男神… 每天換一種聲音陪伴
    發(fā)表于 04-24 16:11

    百度AI手語數(shù)字人助力聽障人士“聽見”聲音

    近幾年,百度先后與天津理工大學(xué)、鯨言科技合作,共同研發(fā)出百度智能云曦靈AI手語平臺(tái)與雙向手語翻譯機(jī),讓手語的“聲音”,被更多人聽見。
    的頭像 發(fā)表于 02-21 11:29 ?1326次閱讀

    hyper-v復(fù)制,Hyper-V 復(fù)制的操作步驟

    ? ? 在使用Hyper-V虛擬化技術(shù)時(shí),數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性至關(guān)重要。Hyper-V復(fù)制功能就像是給虛擬機(jī)數(shù)據(jù)上了一份“保險(xiǎn)”,能在關(guān)鍵時(shí)刻發(fā)揮重要作用。 ? ?什么是Hyper-V復(fù)制
    的頭像 發(fā)表于 02-10 10:29 ?825次閱讀
    hyper-v<b class='flag-5'>復(fù)制</b>,Hyper-V <b class='flag-5'>復(fù)制</b>的操作步驟

    hyper v 復(fù)制,hyper v 復(fù)制如何操作

    工作效率。今天就為大家介紹hyperv復(fù)制如何操作。 ? ?Hyper-V提供了多種方法來實(shí)現(xiàn)文件復(fù)制和共享,以下是幾種常見的操作方法: ? ?方法一:通過網(wǎng)絡(luò)共享復(fù)制文件 ? ?在主機(jī)上創(chuàng)建共享文件夾: ? ?在主機(jī)系統(tǒng)中創(chuàng)建
    的頭像 發(fā)表于 01-22 16:01 ?1580次閱讀
    hyper v <b class='flag-5'>復(fù)制</b>,hyper v <b class='flag-5'>復(fù)制</b>如何操作

    如何辨別網(wǎng)線真假

    辨別網(wǎng)線的真假可以從以下幾個(gè)方面入手: 一、查看包裝和標(biāo)識(shí) 檢查包裝:正品網(wǎng)線的包裝通常比較精美,紙質(zhì)較好,上面的印刷信息清晰,包括產(chǎn)品產(chǎn)地、執(zhí)行標(biāo)準(zhǔn)、種類、長度等。有些品牌還會(huì)在外包裝上貼上防偽
    的頭像 發(fā)表于 01-10 10:28 ?2981次閱讀

    KT148A語音芯片的聲音小,如何讓喇叭聲音變大?聲音影響注意點(diǎn)

    聲音的大小是一個(gè)系統(tǒng)的工作,KT148A本身驅(qū)動(dòng)聲音的能力是很大的,達(dá)到200mA,通過電流也可以看出來。所以一般8歐姆1w以內(nèi)的,不需要考慮外掛功放 喇叭的選擇原則上越大越好,視結(jié)構(gòu)而定。 盡量選擇紙盆類型的喇叭【某寶搜搜】,發(fā)聲更清晰,更大,也就貴一點(diǎn)點(diǎn)而已
    的頭像 發(fā)表于 01-10 09:53 ?1222次閱讀
    KT148A語音芯片的<b class='flag-5'>聲音</b>小,如何讓喇叭<b class='flag-5'>聲音</b>變大?<b class='flag-5'>聲音</b>影響注意點(diǎn)