chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI精確復(fù)制聲音, 真假“比爾·蓋茨”難辨

Gv1N_smartman16 ? 來源:yxw ? 2019-06-15 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日, 臉書的研究人員成功克隆了微軟總裁比爾·蓋茨的聲音。

臉書人工智能研究中心的肖恩·瓦斯奎茲(Sean Vasquez)和邁克·劉易斯(Mike Lewis)于本周表示,他們已經(jīng)努力模仿人類語言有一段時間了。然而,模仿人類語言顯然是件難事,當(dāng)人們聽到斯蒂芬·霍金所使用的那套最著名的說話機(jī)器發(fā)聲時,會發(fā)現(xiàn)它聽起來仍然很不像人類。

但是現(xiàn)在,研究員們似乎已經(jīng)取得了進(jìn)展。如果你聽了蓋茨的克隆所發(fā)出的聲音,我想你是會同意的。因為它聽起來很像比爾·蓋茨,你甚至很難分辨出它和他真實聲音的區(qū)別。

研究人員展示了他們的研究。在這里,機(jī)器模仿著蓋茨的腔調(diào)發(fā)聲,“請給你珍愛的朋友發(fā)一封充滿愛意的短信。”其中最不可思議的是,這臺機(jī)器在說“珍愛(cherish)”時,準(zhǔn)確無誤地捕捉到蓋茨不斷上升的語調(diào)變化的。

這項技術(shù)被稱為MelNet,可以用來復(fù)制人類的語調(diào)。到目前為止,蓋茨和其他許多人的聲音都被它完美地再現(xiàn)了。瓦斯奎茲和劉易斯說,克隆的音頻取自各類Ted演講。

兩位研究人員還表示,直到最近,文本到語音轉(zhuǎn)換軟件還不能很好地工作的原因是它使用了波形圖記錄聲音。這些圖顯示了聲音在幾秒鐘內(nèi)的音階變化。如果你聽到過蓋茨說“珍愛”這個詞,就知道他的語氣是變化劇烈的。在試圖模仿一個人的時候,深度學(xué)習(xí)機(jī)器必須預(yù)測到所有這些細(xì)微的變化,這很不容易。

瓦斯奎茲和劉易斯說,他們通過使用一種叫做光譜圖的東西來訓(xùn)練機(jī)器,成功地克隆了聲音。

研究人員說:“光譜圖的時間軸比波形圖的時間軸緊湊幾個數(shù)量級,這意味著在波形中跨越數(shù)萬個時間步長的依賴關(guān)系在光譜圖中只跨越數(shù)百個時間步長。這使得我們的光譜圖模型能夠在數(shù)秒內(nèi)記錄各種語音和音樂樣本,并保持它們一致性?!?/p>

不過,他們也經(jīng)歷了一些挫折。研究小組表示,對他們來說,幾乎完美地復(fù)制一個句子并不難,難的是復(fù)制那些在長達(dá)幾十秒或幾分鐘的時間里,顯示了情緒變化的復(fù)雜語調(diào)”。盡管如此,當(dāng)涉及到人機(jī)交互時,研究小組說,在只涉及簡短對話的情境中,這項技術(shù)可能會帶來革命性的變化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41295

    瀏覽量

    302669
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137241
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    829

    瀏覽量

    50350

原文標(biāo)題:AI精確復(fù)制聲音, 真假“比爾·蓋茨”難辨

文章出處:【微信號:smartman163,微信公眾號:網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    [完結(jié)15章]Java轉(zhuǎn) AI高薪領(lǐng)域必備-從0到1打通生產(chǎn)級AI Agent開發(fā)

    拒絕原地踏步:Java工程師AI轉(zhuǎn)型的底層技術(shù)破局之道 在軟件工程范式被大語言模型(LLM)徹底顛覆的今天,傳統(tǒng)的“Java CRUD boy”正面臨著前所未有的生存危機(jī)。當(dāng)業(yè)務(wù)邏輯的生成可以被
    發(fā)表于 04-30 13:46

    還在手動拼接 AI 代碼?你的 IDE 早就該升級了

    的定位是代碼編輯與編譯,本身不具備 AI 生成與優(yōu)化能力。開發(fā)者進(jìn)行 AI 相關(guān)開發(fā)時,不得不同時打開多個工具:一邊是編寫主程序的 IDE,一邊是生成 AI 代碼的第三方工具。 ▌ 手動復(fù)
    發(fā)表于 03-11 10:25

    如何查看小智是否成功進(jìn)入聲音設(shè)置?

    你可以通過后臺頁面狀態(tài)、設(shè)備反饋、語音測試三種方式,快速確認(rèn)小智是否成功進(jìn)入聲音設(shè)置并生效。 一、后臺頁面直接查看(最準(zhǔn)) 登錄小智AI后臺:https://xiaozhi.me/console
    發(fā)表于 02-16 06:39

    Transformer 入門:從零理解 AI 大模型的核心原理

    : 身高:175cm 體重:70kg 年齡:25歲 我們可以把這些數(shù)字排成一排:[175, 70, 25],這就是一個向量! arduino 體驗AI代碼助手 代碼解讀 復(fù)制代碼 向量就像一張
    發(fā)表于 02-10 16:33

    使用NORDIC AI的好處

    運動/手勢識別、可穿戴健康監(jiān)測、預(yù)測性維護(hù)、樓宇與工業(yè)傳感網(wǎng)絡(luò)本地分析、聲音/關(guān)鍵詞/圖像識別等,都有官方明確提到的典型用例。[Unlock Edge AI 博客; Nordic Edge AI 技術(shù)頁]
    發(fā)表于 01-31 23:16

    純4G?血版AI小智產(chǎn)品方案 #小智AI #AI方案商 #4G通話 #AI終端產(chǎn)品

    AI
    不太正經(jīng)的攻城獅
    發(fā)布于 :2025年12月21日 14:36:55

    IC聲音放大芯片怎么焊接區(qū)分啊,好小感覺四面都一樣?

    想做一個簡單的基于ESP32的AI語音識別助手,焊接好的聲音輸出一直是000。
    發(fā)表于 12-09 22:08

    【CPKCOR-RA8D1】關(guān)于AI人臉檢測移植遇到的一些問題

    /MainLoop_obj.cc、src/ai_apps/common/Main.cc 等文件已復(fù)制到項目并未被排除在構(gòu)建之外。 確認(rèn)工程配置包含 C++ 編譯器 設(shè)置,并在 C++ 編譯選項加入 -std=c++11(或更高
    發(fā)表于 10-31 13:39

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    釋放聲音的維度:高性能評估板為沉浸式音頻體驗快速便捷構(gòu)建聲場工具

    A316-V71-Game-V1是一款基于XMOS XU316技術(shù)的虛擬7.1游戲聲卡評估平臺,能夠?qū)⒘Ⅲw聲音頻轉(zhuǎn)換為虛擬7.1聲道環(huán)繞聲,為游戲玩家提供身臨其境的音頻體驗,幫助精確定位游戲中的聲音方向。
    的頭像 發(fā)表于 09-30 14:14 ?564次閱讀
    釋放<b class='flag-5'>聲音</b>的維度:高性能評估板為沉浸式音頻體驗快速便捷構(gòu)建聲場工具

    如何進(jìn)行聲音定位?

    文章主要介紹了如何利用一種簡單的TDOA算法進(jìn)行聲音點位,并使用數(shù)據(jù)采集卡進(jìn)行聲音定位的實驗。
    的頭像 發(fā)表于 09-23 15:47 ?2171次閱讀
    如何進(jìn)行<b class='flag-5'>聲音</b>定位?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    復(fù)制人類智能的AI---AGI。 走向AGI的五個層次發(fā)現(xiàn)階段: ①L1,聊天機(jī)器人:具備基礎(chǔ)的對話能力,能夠理解和回應(yīng)簡單的文本輸入 ②L2,推理者:具備基本的邏輯推理能力,能夠分析復(fù)雜信息并進(jìn)行推斷
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個范式了,與實驗科學(xué)、理論科學(xué)、計算科學(xué)、數(shù)據(jù)驅(qū)動科學(xué)一起構(gòu)成
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實現(xiàn)。 而大腦是一個由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺濕潤的軟組織
    發(fā)表于 09-06 19:12

    聲源定位模塊-AR1105# 聲源定位# 聲音定位

    聲音降噪
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年08月01日 16:01:09