chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Stability AI推出Stable audio的文本到音頻生成人工智能平臺

IEEE電氣電子工程師 ? 來源:IEEE電氣電子工程師 ? 2023-09-20 10:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Stability AI是一家主要以人工智能生成的視覺效果而聞名的公司,它推出了一個名為Stable audio的文本到音頻生成人工智能平臺。

Stable Audio使用擴(kuò)散模型,與該公司更受歡迎的圖像平臺Stable diffusion的AI模型相同,但使用音頻而非圖像進(jìn)行訓(xùn)練。用戶可以使用它為任何項(xiàng)目生成歌曲或背景音頻。

音頻擴(kuò)散模型傾向于生成固定長度的音頻,這對音樂制作來說很糟糕,因?yàn)楦枨拈L度可能不同。Stability AI的新平臺允許用戶發(fā)出不同長度的聲音,要求公司對音樂進(jìn)行訓(xùn)練,并在歌曲的開始和結(jié)束時間周圍添加文本元數(shù)據(jù)。

同時,它可以實(shí)現(xiàn)實(shí)時的音頻生成,無需等待長時間的渲染過程。Stability AI 宣稱,Stable Audio 模型可以在一秒內(nèi)渲染出 95 秒的立體聲音頻,并且只需要一個 NVIDIA A100 GPU

并且,Stable Audio是一個開源的項(xiàng)目,任何人都可以免費(fèi)使用和修改。Stability AI 希望通過開源的方式促進(jìn) AI 領(lǐng)域的創(chuàng)新和發(fā)展,并讓更多人享受到 AI 技術(shù)帶來的便利和樂趣。

該公司在一份聲明中表示:“Stable Audio代表了Stability AI生成音頻研究實(shí)驗(yàn)室Harmonai的尖端音頻生成研究。我們會繼續(xù)改進(jìn)我們的模型架構(gòu)、數(shù)據(jù)集和訓(xùn)練程序,以提高輸出質(zhì)量、可控性、推理速度和輸出長度?!?/p>

文本到音頻的生成并不是什么新鮮事,因?yàn)樯扇斯ぶ悄茴I(lǐng)域的其他大牌一直在玩弄這個概念。Meta于8月發(fā)布了AudioCraft,這是一套生成的人工智能模型,有助于根據(jù)提示創(chuàng)建聽起來自然的ERM、聲音和音樂。到目前為止,它只提供給研究人員和一些音頻專業(yè)人士。谷歌的MusicLM也可以讓人們產(chǎn)生聲音,但只對研究人員開放。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻
    +關(guān)注

    關(guān)注

    31

    文章

    3106

    瀏覽量

    84618
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37210

    瀏覽量

    291642
  • 人工智能
    +關(guān)注

    關(guān)注

    1812

    文章

    49536

    瀏覽量

    259194
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3618

    瀏覽量

    51529
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1229

    瀏覽量

    25956

原文標(biāo)題:Stability AI發(fā)布AI音頻平臺Stable Audio

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    全球首個動漫專屬AI頻生成平臺Animon,國內(nèi)版"萌動AI"正式發(fā)布

    平臺Animon正式推出國內(nèi)版產(chǎn)品——"萌動AI",為數(shù)億創(chuàng)作者帶來視覺革命。該平臺由專業(yè)的動漫制作團(tuán)隊(duì)和頂尖的AI技術(shù)團(tuán)隊(duì)聯(lián)合打造,并將專
    的頭像 發(fā)表于 09-25 12:33 ?383次閱讀

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    應(yīng)用場景。從數(shù)據(jù)采集,模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實(shí)訓(xùn),讓你深度體驗(yàn)AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習(xí)需求 對于高校教學(xué)或者技術(shù)學(xué)習(xí)來說,課程覆蓋的廣度
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    應(yīng)用場景。從數(shù)據(jù)采集,模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實(shí)訓(xùn),讓你深度體驗(yàn)AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習(xí)需求 對于高校教學(xué)或者技術(shù)學(xué)習(xí)來說,課程覆蓋的廣度
    發(fā)表于 08-07 14:23

    生成人工智能認(rèn)證:重構(gòu)AI時代的人才培養(yǎng)與職業(yè)躍遷路徑

    ,恰似一座連接技術(shù)前沿與個體成長的橋梁,既承載著時代對人才的迫切需求,也指向著未來職場的核心競爭力。 一、技術(shù)革命的雙重性:賦能與失衡并存 生成人工智能的突破性,在于其首次讓機(jī)器具備了“無中生有”的創(chuàng)造力。從文本生成
    的頭像 發(fā)表于 05-23 09:29 ?463次閱讀

    生成人工智能認(rèn)證:重塑AI時代職業(yè)版圖的鑰匙

    在科技浪潮席卷全球的今天,人工智能AI)已從科幻概念進(jìn)化為驅(qū)動社會變革的核心力量。其中,生成人工智能(Generative AI)作為技
    的頭像 發(fā)表于 05-23 09:18 ?440次閱讀

    生成人工智能認(rèn)證:重塑AI職業(yè)生態(tài)的底層邏輯

    人工智能技術(shù)滲透至社會毛細(xì)血管的今天,生成人工智能(Generative AI)的崛起正在改寫人類與技術(shù)的協(xié)作范式。從ChatGPT引爆的全球熱潮,
    的頭像 發(fā)表于 05-23 09:17 ?375次閱讀

    Arm與Stability AI攜手合作加快文本轉(zhuǎn)音頻的響應(yīng)速度

    ”,幾秒鐘后,你的設(shè)備就會為你生成合適的聲音,甚至無需聯(lián)網(wǎng)就可實(shí)現(xiàn)。得益于 Arm 和 Stability AI 的新合作,這種完全在端側(cè)直接生成
    的頭像 發(fā)表于 03-25 15:54 ?637次閱讀

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    用戶的視頻生成請求和展示生成的視頻結(jié)果。 將前端界面與語聚AI平臺中的AI助手進(jìn)行集成,確保前端能夠正確地調(diào)用
    發(fā)表于 03-05 19:52

    字節(jié)跳動即將推出多模態(tài)視頻生成模型OmniHuman

    一條完整的AI視頻。 據(jù)即夢AI相關(guān)負(fù)責(zé)人透露,OmniHuman模型在研發(fā)過程中融入了前沿的人工智能技術(shù),通過復(fù)雜的算法和深度學(xué)習(xí)機(jī)制,實(shí)現(xiàn)了圖片與音頻的精準(zhǔn)匹配和視頻內(nèi)容的
    的頭像 發(fā)表于 02-08 10:53 ?1030次閱讀

    #新年新氣象,大家新年快樂!#AIGC入門及鴻蒙入門

    Generated Content,即人工智能生成內(nèi)容。它利用人工智能技術(shù)自動生成或輔助生成文本、圖像、
    發(fā)表于 01-13 10:46

    AIGC入門及鴻蒙入門

    Generated Content,即人工智能生成內(nèi)容。它利用人工智能技術(shù)自動生成或輔助生成文本、圖像、
    發(fā)表于 01-13 10:32

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計劃。Sora模型能夠基于文本和圖像生成視頻,引發(fā)了廣泛關(guān)注。然而,由于訪問量遠(yuǎn)超預(yù)期,OpenAI此
    的頭像 發(fā)表于 12-20 14:23 ?827次閱讀

    OpenAI推出AI頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的
    的頭像 發(fā)表于 12-12 09:40 ?947次閱讀

    OpenAI開放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能頻生成系統(tǒng)Sora已正式向美國及其他市場的ChatGPT Plus訂閱用戶開放。自去年首次公開預(yù)覽以來,Sora歷經(jīng)約10個月的精心研發(fā)與優(yōu)化,現(xiàn)已全面
    的頭像 發(fā)表于 12-10 11:16 ?946次閱讀

    生成AI工具作用

    生成AI工具是指那些能夠自動生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.
    的頭像 發(fā)表于 10-28 11:19 ?1069次閱讀