chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AI使用音頻剪輯對與語音匹配的真實感面部建模

倩倩 ? 來源:新經(jīng)網(wǎng) ? 2020-04-11 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

您是否曾經(jīng)僅僅根據(jù)他們的聲音來構造一個從未見過的人的心理形象?人工智能AI)現(xiàn)在可以做到這一點,僅使用簡短的音頻剪輯作為參考即可生成人臉的數(shù)字圖像。

這個名為“ Speech2Face” 的神經(jīng)網(wǎng)絡(一種以類似于人腦的方式“思考”的計算機)經(jīng)過科學家培訓,接受了來自互聯(lián)網(wǎng)的數(shù)百萬個教育視頻,顯示了100,000多個不同的人在說話。

研究人員在一項新研究中寫道,Speech2Face通過該數(shù)據(jù)集學習了語音提示與人臉某些物理特征之間的關聯(lián)。然后,AI使用音頻剪輯對與語音匹配的真實感面部建模。

值得慶幸的是,人工智能還不能僅僅根據(jù)他們的聲音確切地知道特定的人是什么樣。研究作者報告說,神經(jīng)網(wǎng)絡識別語音中的某些標記,這些標記指向性別,年齡和種族,是許多人共有的特征。

科學家寫道:“因此,該模型只會產(chǎn)生看上去普通的面孔。” “它不會產(chǎn)生特定個人的圖像。”

盡管坦率地說,對貓的解釋有點讓人恐懼,但AI已經(jīng)證明它可以產(chǎn)生出異常準確的人臉。

由Speech2Face生成的臉部-均面向正面并具有中性表情-與聲音背后的人并不完全匹配。但是,根據(jù)這項研究,這些圖像通常確實可以捕捉到正確的年齡范圍,種族和性別。

但是,該算法的解釋遠非完美。當面對語言變化時,Speech2Face表現(xiàn)出“混合表現(xiàn)”。例如,當AI收聽亞洲人講中文的音頻片段時,該程序會產(chǎn)生亞洲人臉的圖像。然而,據(jù)科學家報道,當同一個人用不同的音頻片段講英語時,人工智能產(chǎn)生了白人的面孔。

該算法還顯示出性別偏見,將低音調(diào)的聲音與男性面孔相關聯(lián),將高音調(diào)的聲音與女性面孔相關聯(lián)。研究人員寫道,由于訓練數(shù)據(jù)集僅代表YouTube上的教育視頻,因此“并不代表整個世界人口。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    炬芯科技亮相2025亞洲AI音頻大會

    近日,2025亞洲AI音頻大會在深圳成功舉辦,作為中國行業(yè)現(xiàn)象級盛會之一,大會分享和展示音頻技術的最新成果。炬芯科技便攜式音頻事業(yè)部產(chǎn)品總監(jiān)張洪波受邀出席,以《全場景
    的頭像 發(fā)表于 09-29 11:36 ?2430次閱讀

    廣州唯創(chuàng)電子混音IC播報語音芯片:革新音頻應用的新力量

    音頻源智能混音,開啟音頻交互新紀元在智能化浪潮席卷各行各業(yè)的今天,音頻處理技術正經(jīng)歷著革命性的變革。傳統(tǒng)的單一路徑語音播放已無法滿足日益復雜的應用場景需求,混音播報
    的頭像 發(fā)表于 09-24 09:25 ?262次閱讀
    廣州唯創(chuàng)電子混音IC播報<b class='flag-5'>語音</b>芯片:革新<b class='flag-5'>音頻</b>應用的新力量

    唯創(chuàng)知音AI語音交互芯片與模組介紹

    AI語音交互已經(jīng)成為智能產(chǎn)品的基礎配置,比如常見的AI玩具、智能家居、帶AI功能的藍牙音響,還有汽車的智能車機和智能穿戴設備等。唯創(chuàng)知音順應市場趨勢推出了WT2606A系列的
    的頭像 發(fā)表于 09-17 15:51 ?342次閱讀
    唯創(chuàng)知音<b class='flag-5'>AI</b><b class='flag-5'>語音</b>交互芯片與模組介紹

    解鎖高品質(zhì)音頻體驗:探索音頻質(zhì)量評估與測試的科學之道

    高品質(zhì)音頻的科學世界!二、音頻質(zhì)量評估簡介語音質(zhì)量評估就是通過人類或自動化的方法評價語音質(zhì)量。在實踐中,有很多主觀和客觀的方法評價語音質(zhì)量。
    發(fā)表于 07-22 11:15

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網(wǎng)絡即可實現(xiàn)智能功能的特性,在一些網(wǎng)絡條件受限或?qū)?shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK6大模型語音
    發(fā)表于 07-04 11:14

    AI玩具爆發(fā),音頻編解碼器如何滿足語音交互需求

    電子發(fā)燒友網(wǎng)綜合報道,在AI玩具已經(jīng)開始逐漸爆發(fā)的當下,人機交互已經(jīng)成為標配功能,而最重要的便是語音控制。而語音控制的第一步,便需要讓AI玩具聽懂你在說什么這就需要用到
    的頭像 發(fā)表于 06-20 01:07 ?6717次閱讀

    90元打造小智AI腕表,語音交互超有趣!

    ,分辨率 240*280,支持觸摸。 語音交互:內(nèi)置麥克風,支持語音喚醒和語音指令。 音頻播放:1609 8Ω/1W 喇叭。 外殼設計:智能手表。 鋰電池:302535 320mAh,
    發(fā)表于 04-16 14:26

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    一、功能介紹小智AI聊天機器人是一個基于嵌入式硬件與人工智能技術深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結合語音喚醒、自然語言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實現(xiàn)
    發(fā)表于 03-29 16:30

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機器人是一個基于嵌入式硬件與人工智能技術深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結合語音喚醒、自然語言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實現(xiàn)人機交互功能
    的頭像 發(fā)表于 03-29 15:33 ?9272次閱讀
    零知開源——ESP32<b class='flag-5'>語音</b>交互系統(tǒng)(<b class='flag-5'>AI</b>小智)開發(fā)教程

    借助Arm技術革新未來手游體驗

    手游正在不斷得到重塑。隨著內(nèi)容創(chuàng)作、真實感和沉浸式體驗的顯著發(fā)展,移動設備上的游戲開發(fā)和體驗方式正在發(fā)生快速演變。
    的頭像 發(fā)表于 03-10 09:17 ?1011次閱讀

    芯知識 決定語音芯片高音質(zhì)的因素

    語音芯片高音質(zhì)因素包括高分辨率音頻、低失真高動態(tài)范圍、高品質(zhì)音頻編解碼、深度音頻處理及VR/AR音頻體驗,這些因素共同提升
    的頭像 發(fā)表于 02-17 14:56 ?461次閱讀

    用Reality AI Tools創(chuàng)建模

    在第二步采集到的數(shù)據(jù)基礎之上,用Reality AI Tools創(chuàng)建模型。
    的頭像 發(fā)表于 01-22 14:23 ?2677次閱讀
    用Reality <b class='flag-5'>AI</b> Tools創(chuàng)<b class='flag-5'>建模</b>型

    HarmonyOS NEXT 應用開發(fā)練習:AI智能語音播報

    一、DEMO思路 在這個HarmonyOS NEXT原生應用DEMO中,我們將使用ArkTS開發(fā)語言創(chuàng)建一個簡單的AI智能語音播報應用。 該應用能夠接收用戶輸入的文本,并使用TTS
    發(fā)表于 01-06 15:33

    充電樁語音方案,支持OTA語音升級的音頻芯片NV400F

    1產(chǎn)品市場隨著新能源汽車的普及,充電樁作為其核心配套設施,其智能化、便捷化的需求日益增長。充電樁語音方案,尤其是支持OTA(Over-The-Air)語音升級的音頻芯片NV400F,正逐步成為市場上
    的頭像 發(fā)表于 11-09 01:03 ?1057次閱讀
    充電樁<b class='flag-5'>語音</b>方案,支持OTA<b class='flag-5'>語音</b>升級的<b class='flag-5'>音頻</b>芯片NV400F

    tlv320Ai32在輸出音頻時總有絲絲聲,為什么?

    tlv320Ai32在輸出音頻時總有絲絲聲,即使輸出的濾波將噪聲調(diào)整到90mV以下還是存在。測試發(fā)現(xiàn)HPout的噪聲有將近480mV 請問這是什么原因,Ai32還有什么寄存器要設置的? 模擬電源的紋波大概60mV,有影響嗎?
    發(fā)表于 11-05 06:09