chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook機器學習模仿真人聲音,安全性引人擔憂

hl5C_deeptechch ? 來源:YXQ ? 2019-06-13 09:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器語音系統(tǒng)一直有點令人失望:即使是最好的文本語音轉(zhuǎn)換系統(tǒng)也擺脫不了機械的特性,缺乏人類說話時的基本語調(diào)變化。斯蒂芬·霍金使用的語音系統(tǒng)就是一個很好的例子。

但近年來,機器學習取得了巨大進步,也改善了機器語音系統(tǒng)的一些缺點。

最近,F(xiàn)acebook 人工智能研究中心的 Sean Vasquez 和 Mike Lewis 發(fā)現(xiàn)了一種可以克服從文本到語音系統(tǒng)轉(zhuǎn)換限制,完全由機器生成而且音頻片段極其逼真的方法。這一系統(tǒng)被稱為 MelNet,它不僅可以復制人類的語調(diào),而且可以用與真人相同的聲音。于是,研究小組開始訓練該系統(tǒng),讓它模仿出比爾·蓋茨等人的說話。這項工作讓人類和電腦之間更真實的互動成為可能,不僅如此,它的逼真程度,很可能引發(fā)虛假音頻內(nèi)容騙術(shù)的新問題。

圖丨比爾·蓋茨(來源:麻省理工科技評論)

現(xiàn)實中的文本—語音轉(zhuǎn)換系統(tǒng)進展緩慢并非是因為缺乏嘗試。許多團隊一直在嘗試訓練深度學習算法,利用大型音頻數(shù)據(jù)庫重現(xiàn)真實的語音模式。

Vasquez 和 Lewis 說,這種方法的問題在于使用的數(shù)據(jù)類型。到目前為止,大多數(shù)工作都集中在音頻波形記錄上。這些音頻波形顯示了聲音的振幅如何隨時間而變化,它每秒記錄的音頻包含數(shù)萬個時間步長。

這些波形能在許多不同的尺度上顯示出特定模式。例如,在幾秒鐘的講話中,波形反映了與單詞序列相關(guān)的特征模式。但是在微秒級的片段中,波形顯示了與聲音的音高和音色相關(guān)的特征。在其他尺度上,波形反映了說話人的語調(diào)、音素結(jié)構(gòu)等。

另一種方法是將波形在一個時間步長和下一個時間步長之間的關(guān)聯(lián)性考慮進來。所以,在給定的時間范圍內(nèi),一個單詞開頭的聲音與后面的聲音是有關(guān)聯(lián)的。

深度學習系統(tǒng)理應(yīng)善于學習這些類型的關(guān)聯(lián)性,并對它們進行復制。但問題出在不同時間尺度的關(guān)聯(lián)性上,深度學習系統(tǒng)只能在有限的時間尺度上研究這些關(guān)聯(lián)性。這是因為深度學習使用了一種叫做反向傳播的學習過程,這種學習過程不斷地重新連接網(wǎng)絡(luò),根據(jù)所看到的示例改進其性能。

重復率限制了系統(tǒng)學習關(guān)聯(lián)性的時間尺度。因此,深度學習網(wǎng)絡(luò)可以學習長時間或短時間內(nèi)音頻波形的關(guān)聯(lián)性,但不能同時兼顧兩者。這就是為什么它們在復制語音方面表現(xiàn)如此糟糕的原因。

Vasquez 和 Lewis 則有不同的方法。他們使用聲譜圖而不是音頻波形來訓練他們的深度學習網(wǎng)絡(luò)。聲譜圖記錄了整個音頻頻譜及其隨時間的變化。所以當波形捕捉到隨時間變化的一個參數(shù),例如振幅時,光譜圖則捕捉到了不同頻率范圍內(nèi)的振幅變化。

這意味著音頻信息被更密集地打包到了這種類型的數(shù)據(jù)中。研究者認為:聲譜圖的時間軸比波形的時間軸緊湊幾個數(shù)量級,這意味著在波形中跨越數(shù)萬個時間步長的依賴關(guān)系只跨越聲譜圖中的數(shù)百個時間步長。

這使得深度學習系統(tǒng)更容易獲得關(guān)聯(lián)性。他們說:“這使得我們的聲譜模型能夠在數(shù)秒內(nèi)產(chǎn)生一致的無條件語音和音樂樣本?!?/p>

圖丨聲譜圖 VS 波形圖(來源:Facebook)

最后的結(jié)果令人印象深刻。通過使用 TED 演講中的普通語音訓練系統(tǒng),MelNet 能夠在幾秒鐘內(nèi)復制 TED 演講者的聲音,或多或少地說出一些內(nèi)容。Facebook 的研究人員利用比爾·蓋茨的 TED 演講來訓練 MelNet,然后用比爾·蓋茨的聲音說出一系列隨機的短語,以此展示了 MelNet 的靈活性。

當然,該方法也有一些限制。普通言語包含了更長時間尺度上的相關(guān)性。例如,在幾十秒或幾分鐘的演講進程中,人們會使用語調(diào)的變化來表示主題或情緒的變化。Facebook 的機器系統(tǒng)似乎還無法做到這一點。

因此,盡管 MelNet 可以創(chuàng)造出非常逼真的短語,但團隊還不能讓機器完成較長的句子、段落或整個故事。這個目標似乎不是很快就能實現(xiàn)。

然而,這項工作可能會對人機交互產(chǎn)生重大影響。人機交互中許多對話只包含簡短的短語。電話接線員和服務(wù)臺尤其可以使用一系列相對簡短的短語。因此,這項技術(shù)可以用一種比當前系統(tǒng)更接近人類的方式來優(yōu)化這些交互。

不過,目前 Vasquez 和 Lewis 對潛在的應(yīng)用前景守口如瓶。

當然,自然發(fā)聲的機器也存在潛在的問題,尤其是那些能夠逼真模仿人類的機器。很容易想象,這種技術(shù)可能被用于惡作劇的場景。正因為如此,這是人工智能的又一進步,它提出的倫理問題比它所能回答的問題要更多。它所能回答的問題要更多。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1432

    瀏覽量

    58971
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8556

    瀏覽量

    137019

原文標題:Facebook 的 AI,已經(jīng)可以用比爾·蓋茨的聲音說話

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    從 M0 到 M3丨笙泉32 位 MCU:高效能、安全性與多元應(yīng)用兼具

    從 M0 到 M3丨笙泉32 位 MCU:高效能、安全性與多元應(yīng)用兼具 笙泉32位MCU打造多元應(yīng)用控制方案 32 位 MCU(單片機 / 微控制器),如 Arm? Cortex?-M0
    發(fā)表于 03-10 15:29

    請問VisionFive 2 的熱安全性如何?

    我的 VisionFive 2 目前沒有風扇。如果我開始以 100% 的速度使用 CPU,我應(yīng)該擔心它過熱嗎? 為了安全起見,它會進行熱節(jié)流嗎? 如果是這樣,如何查看它是否處于熱節(jié)流狀態(tài)?
    發(fā)表于 02-27 06:31

    自動駕駛中常提的模仿學習是什么?

    當談及自動駕駛模型學習時,經(jīng)常會提到模仿學習的概念。所謂模仿學習,就是模型先看別人怎么做,然后學著去做。自動駕駛中的
    的頭像 發(fā)表于 01-16 16:41 ?2011次閱讀

    機器人用霍爾電流傳感器,能提升操作安全性么?

    安全?;魻栯娏鱾鞲衅髯鳛?b class='flag-5'>機器人電力系統(tǒng)的“感知核心”,通過實時監(jiān)測電流信號、精準反饋運行狀態(tài),為機器人構(gòu)建全鏈路安全防護體系,成為提升操作安全性
    的頭像 發(fā)表于 12-22 09:04 ?1417次閱讀
    <b class='flag-5'>機器</b>人用霍爾電流傳感器,能提升操作<b class='flag-5'>安全性</b>么?

    請問CW32L052C8T6這種安全性低功耗MCU的安全固件部分怎么實現(xiàn)?

    請問,CW32L052C8T6這種安全性低功耗MCU的安全固件部分怎么實現(xiàn)?
    發(fā)表于 12-05 07:19

    車規(guī)級與消費級芯片的可靠安全性與成本差異

    引言在汽車電子和消費電子領(lǐng)域,"車規(guī)級"與"消費級"芯片代表了兩種截然不同的設(shè)計理念和技術(shù)標準。車規(guī)級芯片專為汽車應(yīng)用設(shè)計,強調(diào)在極端環(huán)境下的可靠安全性
    的頭像 發(fā)表于 11-18 17:27 ?1299次閱讀
    車規(guī)級與消費級芯片的可靠<b class='flag-5'>性</b>、<b class='flag-5'>安全性</b>與成本差異

    有哪些技術(shù)可以提高邊緣計算設(shè)備的安全性

    邊緣計算設(shè)備的安全性面臨分布式部署、資源受限(算力 / 存儲 / 帶寬)、網(wǎng)絡(luò)環(huán)境復雜(多無線連接)、物理接觸易被篡改等獨特挑戰(zhàn),因此其安全技術(shù)需在 “安全性” 與 “輕量化適配” 之間平衡。以下從
    的頭像 發(fā)表于 09-05 15:44 ?1519次閱讀
    有哪些技術(shù)可以提高邊緣計算設(shè)備的<b class='flag-5'>安全性</b>?

    如何驗證硬件加速是否真正提升了通信協(xié)議的安全性?

    驗證硬件加速是否真正提升通信協(xié)議的安全性,需從 安全功能正確、抗攻擊能力增強、安全性能適配、合規(guī)一致 等核心維度展開,結(jié)合實驗室測試與真
    的頭像 發(fā)表于 08-27 10:16 ?1176次閱讀
    如何驗證硬件加速是否真正提升了通信協(xié)議的<b class='flag-5'>安全性</b>?

    如何利用硬件加速提升通信協(xié)議的安全性

    產(chǎn)品實拍圖 利用硬件加速提升通信協(xié)議安全性,核心是通過 專用硬件模塊或可編程硬件 ,承接軟件層面難以高效處理的安全關(guān)鍵操作(如加密解密、認證、密鑰管理等),在提升性能的同時,通過硬件級隔離、防篡改等
    的頭像 發(fā)表于 08-27 09:59 ?1023次閱讀
    如何利用硬件加速提升通信協(xié)議的<b class='flag-5'>安全性</b>?

    宏集分享 | 集中告警管理如何提升設(shè)施安全性?

    提高團隊響應(yīng)速度,優(yōu)化維護運營在工業(yè)或商業(yè)建筑中,集中告警管理已成為確保安全性或檢測故障的必備工具。通過將所有安全系統(tǒng)集中管理,企業(yè)能夠?qū)⑺懈婢y(tǒng)一在一個HMI界面中,大幅提升響應(yīng)速度。關(guān)鍵要點
    的頭像 發(fā)表于 08-08 18:25 ?538次閱讀
    宏集分享 | 集中告警管理如何提升設(shè)施<b class='flag-5'>安全性</b>?

    請問DM平臺訪問安全性如何控制?

    DM平臺訪問安全性如何控制?
    發(fā)表于 08-06 06:01

    SD-WAN供應(yīng)商在安全性方面有哪些差異?服務(wù)商安全性排行

    市場報告,2022年該市場增長達25%,預計2027年規(guī)模將突破75億美元,而**安全性差異**成為企業(yè)選型的首要考量。以下從技術(shù)架構(gòu)、行業(yè)適配等維度解析頭部服務(wù)商
    的頭像 發(fā)表于 07-29 10:14 ?345次閱讀
    SD-WAN供應(yīng)商在<b class='flag-5'>安全性</b>方面有哪些差異?服務(wù)商<b class='flag-5'>安全性</b>排行

    NVIDIA Isaac Lab可用環(huán)境與強化學習腳本使用指南

    Lab 是一個適用于機器人學習的開源模塊化框架,其模塊化高保真仿真適用于各種訓練環(huán)境,Isaac Lab 同時支持模仿學習模仿人類)和強
    的頭像 發(fā)表于 07-14 15:29 ?2393次閱讀
    NVIDIA Isaac Lab可用環(huán)境與強化<b class='flag-5'>學習</b>腳本使用指南

    無刷直流電機控制系統(tǒng)的建模仿真分析

    控制逆變器開關(guān)的導通與關(guān)斷。通過試驗結(jié)果可以看出系統(tǒng)能夠穩(wěn)定適行,進而驗證了該方案的可行。 純分享帖,點擊下方附件免費獲取完整資料~~~ *附件:無刷直流電機控制系統(tǒng)的建模仿真分析.pdf 【免責聲明
    發(fā)表于 06-27 16:52

    品英Pickering公司仿真方案和測試系統(tǒng)滿足航電設(shè)備可靠安全性等更高要求

    ,英國Pickering集團將于2025年5月28-29日在上海舉辦的2025第十四屆飛機航空電子國際論壇中展示多款領(lǐng)先的開關(guān)、仿真方案和測試系統(tǒng),滿足國內(nèi)外航空電子設(shè)備的性能、可靠、安全性和經(jīng)濟
    發(fā)表于 05-22 09:20 ?1144次閱讀
    品英Pickering公司<b class='flag-5'>仿真</b>方案和測試系統(tǒng)滿足航電設(shè)備可靠<b class='flag-5'>性</b>和<b class='flag-5'>安全性</b>等更高要求