chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook機(jī)器學(xué)習(xí)模仿真人聲音,安全性引人擔(dān)憂

hl5C_deeptechch ? 來(lái)源:YXQ ? 2019-06-13 09:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器語(yǔ)音系統(tǒng)一直有點(diǎn)令人失望:即使是最好的文本語(yǔ)音轉(zhuǎn)換系統(tǒng)也擺脫不了機(jī)械的特性,缺乏人類說(shuō)話時(shí)的基本語(yǔ)調(diào)變化。斯蒂芬·霍金使用的語(yǔ)音系統(tǒng)就是一個(gè)很好的例子。

但近年來(lái),機(jī)器學(xué)習(xí)取得了巨大進(jìn)步,也改善了機(jī)器語(yǔ)音系統(tǒng)的一些缺點(diǎn)。

最近,F(xiàn)acebook 人工智能研究中心的 Sean Vasquez 和 Mike Lewis 發(fā)現(xiàn)了一種可以克服從文本到語(yǔ)音系統(tǒng)轉(zhuǎn)換限制,完全由機(jī)器生成而且音頻片段極其逼真的方法。這一系統(tǒng)被稱為 MelNet,它不僅可以復(fù)制人類的語(yǔ)調(diào),而且可以用與真人相同的聲音。于是,研究小組開始訓(xùn)練該系統(tǒng),讓它模仿出比爾·蓋茨等人的說(shuō)話。這項(xiàng)工作讓人類和電腦之間更真實(shí)的互動(dòng)成為可能,不僅如此,它的逼真程度,很可能引發(fā)虛假音頻內(nèi)容騙術(shù)的新問(wèn)題。

圖丨比爾·蓋茨(來(lái)源:麻省理工科技評(píng)論)

現(xiàn)實(shí)中的文本—語(yǔ)音轉(zhuǎn)換系統(tǒng)進(jìn)展緩慢并非是因?yàn)槿狈L試。許多團(tuán)隊(duì)一直在嘗試訓(xùn)練深度學(xué)習(xí)算法,利用大型音頻數(shù)據(jù)庫(kù)重現(xiàn)真實(shí)的語(yǔ)音模式。

Vasquez 和 Lewis 說(shuō),這種方法的問(wèn)題在于使用的數(shù)據(jù)類型。到目前為止,大多數(shù)工作都集中在音頻波形記錄上。這些音頻波形顯示了聲音的振幅如何隨時(shí)間而變化,它每秒記錄的音頻包含數(shù)萬(wàn)個(gè)時(shí)間步長(zhǎng)。

這些波形能在許多不同的尺度上顯示出特定模式。例如,在幾秒鐘的講話中,波形反映了與單詞序列相關(guān)的特征模式。但是在微秒級(jí)的片段中,波形顯示了與聲音的音高和音色相關(guān)的特征。在其他尺度上,波形反映了說(shuō)話人的語(yǔ)調(diào)、音素結(jié)構(gòu)等。

另一種方法是將波形在一個(gè)時(shí)間步長(zhǎng)和下一個(gè)時(shí)間步長(zhǎng)之間的關(guān)聯(lián)性考慮進(jìn)來(lái)。所以,在給定的時(shí)間范圍內(nèi),一個(gè)單詞開頭的聲音與后面的聲音是有關(guān)聯(lián)的。

深度學(xué)習(xí)系統(tǒng)理應(yīng)善于學(xué)習(xí)這些類型的關(guān)聯(lián)性,并對(duì)它們進(jìn)行復(fù)制。但問(wèn)題出在不同時(shí)間尺度的關(guān)聯(lián)性上,深度學(xué)習(xí)系統(tǒng)只能在有限的時(shí)間尺度上研究這些關(guān)聯(lián)性。這是因?yàn)樯疃葘W(xué)習(xí)使用了一種叫做反向傳播的學(xué)習(xí)過(guò)程,這種學(xué)習(xí)過(guò)程不斷地重新連接網(wǎng)絡(luò),根據(jù)所看到的示例改進(jìn)其性能。

重復(fù)率限制了系統(tǒng)學(xué)習(xí)關(guān)聯(lián)性的時(shí)間尺度。因此,深度學(xué)習(xí)網(wǎng)絡(luò)可以學(xué)習(xí)長(zhǎng)時(shí)間或短時(shí)間內(nèi)音頻波形的關(guān)聯(lián)性,但不能同時(shí)兼顧兩者。這就是為什么它們?cè)趶?fù)制語(yǔ)音方面表現(xiàn)如此糟糕的原因。

Vasquez 和 Lewis 則有不同的方法。他們使用聲譜圖而不是音頻波形來(lái)訓(xùn)練他們的深度學(xué)習(xí)網(wǎng)絡(luò)。聲譜圖記錄了整個(gè)音頻頻譜及其隨時(shí)間的變化。所以當(dāng)波形捕捉到隨時(shí)間變化的一個(gè)參數(shù),例如振幅時(shí),光譜圖則捕捉到了不同頻率范圍內(nèi)的振幅變化。

這意味著音頻信息被更密集地打包到了這種類型的數(shù)據(jù)中。研究者認(rèn)為:聲譜圖的時(shí)間軸比波形的時(shí)間軸緊湊幾個(gè)數(shù)量級(jí),這意味著在波形中跨越數(shù)萬(wàn)個(gè)時(shí)間步長(zhǎng)的依賴關(guān)系只跨越聲譜圖中的數(shù)百個(gè)時(shí)間步長(zhǎng)。

這使得深度學(xué)習(xí)系統(tǒng)更容易獲得關(guān)聯(lián)性。他們說(shuō):“這使得我們的聲譜模型能夠在數(shù)秒內(nèi)產(chǎn)生一致的無(wú)條件語(yǔ)音和音樂(lè)樣本?!?/p>

圖丨聲譜圖 VS 波形圖(來(lái)源:Facebook)

最后的結(jié)果令人印象深刻。通過(guò)使用 TED 演講中的普通語(yǔ)音訓(xùn)練系統(tǒng),MelNet 能夠在幾秒鐘內(nèi)復(fù)制 TED 演講者的聲音,或多或少地說(shuō)出一些內(nèi)容。Facebook 的研究人員利用比爾·蓋茨的 TED 演講來(lái)訓(xùn)練 MelNet,然后用比爾·蓋茨的聲音說(shuō)出一系列隨機(jī)的短語(yǔ),以此展示了 MelNet 的靈活性。

當(dāng)然,該方法也有一些限制。普通言語(yǔ)包含了更長(zhǎng)時(shí)間尺度上的相關(guān)性。例如,在幾十秒或幾分鐘的演講進(jìn)程中,人們會(huì)使用語(yǔ)調(diào)的變化來(lái)表示主題或情緒的變化。Facebook 的機(jī)器系統(tǒng)似乎還無(wú)法做到這一點(diǎn)。

因此,盡管 MelNet 可以創(chuàng)造出非常逼真的短語(yǔ),但團(tuán)隊(duì)還不能讓機(jī)器完成較長(zhǎng)的句子、段落或整個(gè)故事。這個(gè)目標(biāo)似乎不是很快就能實(shí)現(xiàn)。

然而,這項(xiàng)工作可能會(huì)對(duì)人機(jī)交互產(chǎn)生重大影響。人機(jī)交互中許多對(duì)話只包含簡(jiǎn)短的短語(yǔ)。電話接線員和服務(wù)臺(tái)尤其可以使用一系列相對(duì)簡(jiǎn)短的短語(yǔ)。因此,這項(xiàng)技術(shù)可以用一種比當(dāng)前系統(tǒng)更接近人類的方式來(lái)優(yōu)化這些交互。

不過(guò),目前 Vasquez 和 Lewis 對(duì)潛在的應(yīng)用前景守口如瓶。

當(dāng)然,自然發(fā)聲的機(jī)器也存在潛在的問(wèn)題,尤其是那些能夠逼真模仿人類的機(jī)器。很容易想象,這種技術(shù)可能被用于惡作劇的場(chǎng)景。正因?yàn)槿绱?,這是人工智能的又一進(jìn)步,它提出的倫理問(wèn)題比它所能回答的問(wèn)題要更多。它所能回答的問(wèn)題要更多。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1432

    瀏覽量

    58365
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8541

    瀏覽量

    136248

原文標(biāo)題:Facebook 的 AI,已經(jīng)可以用比爾·蓋茨的聲音說(shuō)話

文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    請(qǐng)問(wèn)CW32L052C8T6這種安全性低功耗MCU的安全固件部分怎么實(shí)現(xiàn)?

    請(qǐng)問(wèn),CW32L052C8T6這種安全性低功耗MCU的安全固件部分怎么實(shí)現(xiàn)?
    發(fā)表于 12-05 07:19

    車規(guī)級(jí)與消費(fèi)級(jí)芯片的可靠、安全性與成本差異

    引言在汽車電子和消費(fèi)電子領(lǐng)域,"車規(guī)級(jí)"與"消費(fèi)級(jí)"芯片代表了兩種截然不同的設(shè)計(jì)理念和技術(shù)標(biāo)準(zhǔn)。車規(guī)級(jí)芯片專為汽車應(yīng)用設(shè)計(jì),強(qiáng)調(diào)在極端環(huán)境下的可靠安全性
    的頭像 發(fā)表于 11-18 17:27 ?644次閱讀
    車規(guī)級(jí)與消費(fèi)級(jí)芯片的可靠<b class='flag-5'>性</b>、<b class='flag-5'>安全性</b>與成本差異

    有哪些技術(shù)可以提高邊緣計(jì)算設(shè)備的安全性?

    邊緣計(jì)算設(shè)備的安全性面臨分布式部署、資源受限(算力 / 存儲(chǔ) / 帶寬)、網(wǎng)絡(luò)環(huán)境復(fù)雜(多無(wú)線連接)、物理接觸易被篡改等獨(dú)特挑戰(zhàn),因此其安全技術(shù)需在 “安全性” 與 “輕量化適配” 之間平衡。以下從
    的頭像 發(fā)表于 09-05 15:44 ?1043次閱讀
    有哪些技術(shù)可以提高邊緣計(jì)算設(shè)備的<b class='flag-5'>安全性</b>?

    如何驗(yàn)證硬件加速是否真正提升了通信協(xié)議的安全性?

    驗(yàn)證硬件加速是否真正提升通信協(xié)議的安全性,需從 安全功能正確、抗攻擊能力增強(qiáng)、安全性能適配、合規(guī)一致 等核心維度展開,結(jié)合實(shí)驗(yàn)室測(cè)試與真
    的頭像 發(fā)表于 08-27 10:16 ?840次閱讀
    如何驗(yàn)證硬件加速是否真正提升了通信協(xié)議的<b class='flag-5'>安全性</b>?

    如何利用硬件加速提升通信協(xié)議的安全性?

    產(chǎn)品實(shí)拍圖 利用硬件加速提升通信協(xié)議安全性,核心是通過(guò) 專用硬件模塊或可編程硬件 ,承接軟件層面難以高效處理的安全關(guān)鍵操作(如加密解密、認(rèn)證、密鑰管理等),在提升性能的同時(shí),通過(guò)硬件級(jí)隔離、防篡改等
    的頭像 發(fā)表于 08-27 09:59 ?670次閱讀
    如何利用硬件加速提升通信協(xié)議的<b class='flag-5'>安全性</b>?

    請(qǐng)問(wèn)DM平臺(tái)訪問(wèn)安全性如何控制?

    DM平臺(tái)訪問(wèn)安全性如何控制?
    發(fā)表于 08-06 06:01

    SD-WAN供應(yīng)商在安全性方面有哪些差異?服務(wù)商安全性排行

    市場(chǎng)報(bào)告,2022年該市場(chǎng)增長(zhǎng)達(dá)25%,預(yù)計(jì)2027年規(guī)模將突破75億美元,而**安全性差異**成為企業(yè)選型的首要考量。以下從技術(shù)架構(gòu)、行業(yè)適配等維度解析頭部服務(wù)商
    的頭像 發(fā)表于 07-29 10:14 ?345次閱讀
    SD-WAN供應(yīng)商在<b class='flag-5'>安全性</b>方面有哪些差異?服務(wù)商<b class='flag-5'>安全性</b>排行

    無(wú)刷直流電機(jī)控制系統(tǒng)的建模仿真分析

    控制逆變器開關(guān)的導(dǎo)通與關(guān)斷。通過(guò)試驗(yàn)結(jié)果可以看出系統(tǒng)能夠穩(wěn)定適行,進(jìn)而驗(yàn)證了該方案的可行。 純分享帖,點(diǎn)擊下方附件免費(fèi)獲取完整資料~~~ *附件:無(wú)刷直流電機(jī)控制系統(tǒng)的建模仿真分析.pdf 【免責(zé)聲明
    發(fā)表于 06-27 16:52

    電子電器產(chǎn)品安全性與針焰試驗(yàn)的重要

    在當(dāng)今電子電器產(chǎn)品廣泛應(yīng)用的背景下,消費(fèi)者對(duì)其使用安全性愈發(fā)關(guān)注。電子設(shè)備的材料在電作用下可能面臨過(guò)熱應(yīng)力,一旦材料劣化,設(shè)備的安全性能將受到嚴(yán)重影響。針焰試驗(yàn)作為一種關(guān)鍵的阻燃試驗(yàn),能夠有效評(píng)估
    的頭像 發(fā)表于 03-11 17:20 ?758次閱讀
    電子電器產(chǎn)品<b class='flag-5'>安全性</b>與針焰試驗(yàn)的重要<b class='flag-5'>性</b>

    智元機(jī)器人基于NVIDIA Isaac GR00T打造高效仿真數(shù)據(jù)采集方案

    案例簡(jiǎn)介 本案例中,智元機(jī)器人基于 NVIDIA Isaac GR00T-Teleop & GR00T-Mimic 提供的遠(yuǎn)程仿真操作功能和強(qiáng)大的模仿學(xué)習(xí)合成數(shù)據(jù)生成工作流,打造了支持
    的頭像 發(fā)表于 03-07 19:16 ?1767次閱讀
    智元<b class='flag-5'>機(jī)器</b>人基于NVIDIA Isaac GR00T打造高效<b class='flag-5'>仿真</b>數(shù)據(jù)采集方案

    航空航天領(lǐng)域?qū)﹄娫礊V波器可靠安全性的特殊要求

    航空航天領(lǐng)域?qū)﹄娫礊V波器可靠安全性要求極高。從電磁兼容到抗惡劣環(huán)境,從安全性到長(zhǎng)壽命與維護(hù),從輕量化與小型化等都需達(dá)到高標(biāo)準(zhǔn)。隨著航
    的頭像 發(fā)表于 03-07 11:45 ?777次閱讀
    航空航天領(lǐng)域?qū)﹄娫礊V波器可靠<b class='flag-5'>性</b>和<b class='flag-5'>安全性</b>的特殊要求

    物理仿真人機(jī)器人的統(tǒng)一全身控制策略

    創(chuàng)建動(dòng)作自然并對(duì)各種控制輸入做出智能響應(yīng)的交互式仿真人機(jī)器人仍是計(jì)算機(jī)動(dòng)畫和機(jī)器人技術(shù)領(lǐng)域最具挑戰(zhàn)的問(wèn)題之一。NVIDIA Isaac Sim等高性能 GPU 加速
    的頭像 發(fā)表于 01-06 12:31 ?1635次閱讀
    物理<b class='flag-5'>仿真人</b>形<b class='flag-5'>機(jī)器</b>人的統(tǒng)一全身控制策略

    AGV在工作時(shí)如何保持高強(qiáng)度安全性

    AGV實(shí)現(xiàn)高效低成本物料運(yùn)輸,安全性高,通過(guò)安全裝置、交通管制避免碰撞。區(qū)域控制、傳感器控制、綜合控制等方式實(shí)現(xiàn)交通管理。AGV提升企業(yè)技術(shù)進(jìn)步,有望在更多領(lǐng)域發(fā)揮廣泛作用。
    的頭像 發(fā)表于 01-02 11:46 ?691次閱讀
    AGV在工作時(shí)如何保持高強(qiáng)度<b class='flag-5'>安全性</b>

    如何實(shí)現(xiàn) HTTP 協(xié)議的安全性

    協(xié)議的安全性,可以采取以下幾種方法: 1. 使用HTTPS HTTPS(安全超文本傳輸協(xié)議)是HTTP的安全版本,它在HTTP的基礎(chǔ)上通過(guò)SSL/TLS協(xié)議提供了數(shù)據(jù)加密、數(shù)據(jù)完整驗(yàn)
    的頭像 發(fā)表于 12-30 09:22 ?1500次閱讀

    集中告警管理如何提升設(shè)施安全性?

    在工業(yè)或商業(yè)建筑中,集中告警管理已成為確保安全性或檢測(cè)故障的必備工具。它是如何提升設(shè)施安全性的?歡迎大家閱讀文章了解~
    的頭像 發(fā)表于 12-13 15:51 ?801次閱讀
    集中告警管理如何提升設(shè)施<b class='flag-5'>安全性</b>?