日韩中文在线观看免费完整版,欧洲mv亚洲mv天堂在线观看

Stability AI是一家主要以人工智能生成的視覺(jué)效果而聞名的公司，它推出了一個(gè)名為Stable audio的文本到音頻生成人工智能平臺(tái)。

Stable Audio使用擴(kuò)散模型，與該公司更受歡迎的圖像平臺(tái)Stable diffusion的AI模型相同，但使用音頻而非圖像進(jìn)行訓(xùn)練。用戶可以使用它為任何項(xiàng)目生成歌曲或背景音頻。

音頻擴(kuò)散模型傾向于生成固定長(zhǎng)度的音頻，這對(duì)音樂(lè)制作來(lái)說(shuō)很糟糕，因?yàn)楦枨拈L(zhǎng)度可能不同。Stability AI的新平臺(tái)允許用戶發(fā)出不同長(zhǎng)度的聲音，要求公司對(duì)音樂(lè)進(jìn)行訓(xùn)練，并在歌曲的開始和結(jié)束時(shí)間周圍添加文本元數(shù)據(jù)。

同時(shí)，它可以實(shí)現(xiàn)實(shí)時(shí)的音頻生成，無(wú)需等待長(zhǎng)時(shí)間的渲染過(guò)程。Stability AI 宣稱，Stable Audio 模型可以在一秒內(nèi)渲染出 95 秒的立體聲音頻，并且只需要一個(gè) NVIDIA A100 GPU。

并且，Stable Audio是一個(gè)開源的項(xiàng)目，任何人都可以免費(fèi)使用和修改。Stability AI 希望通過(guò)開源的方式促進(jìn) AI 領(lǐng)域的創(chuàng)新和發(fā)展，并讓更多人享受到 AI 技術(shù)帶來(lái)的便利和樂(lè)趣。

該公司在一份聲明中表示：“Stable Audio代表了Stability AI生成音頻研究實(shí)驗(yàn)室Harmonai的尖端音頻生成研究。我們會(huì)繼續(xù)改進(jìn)我們的模型架構(gòu)、數(shù)據(jù)集和訓(xùn)練程序，以提高輸出質(zhì)量、可控性、推理速度和輸出長(zhǎng)度?！?/p>

文本到音頻的生成并不是什么新鮮事，因?yàn)樯扇斯ぶ悄茴I(lǐng)域的其他大牌一直在玩弄這個(gè)概念。Meta于8月發(fā)布了AudioCraft，這是一套生成的人工智能模型，有助于根據(jù)提示創(chuàng)建聽(tīng)起來(lái)自然的ERM、聲音和音樂(lè)。到目前為止，它只提供給研究人員和一些音頻專業(yè)人士。谷歌的MusicLM也可以讓人們產(chǎn)生聲音，但只對(duì)研究人員開放。

審核編輯：彭菁

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

音頻

音頻

+關(guān)注

關(guān)注
31

文章
3161

瀏覽量
85198
AI

AI

+關(guān)注

關(guān)注
91

文章
39125

瀏覽量
299750
人工智能

人工智能

+關(guān)注

關(guān)注
1814

文章
49967

瀏覽量
263698
模型

模型

+關(guān)注

關(guān)注
1

文章
3694

瀏覽量
51953
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1235

瀏覽量
26116

原文標(biāo)題：Stability AI發(fā)布AI音頻平臺(tái)Stable Audio

文章出處：【微信號(hào)：IEEE_China，微信公眾號(hào)：IEEE電氣電子工程師】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

Stability AI推出Stable audio的文本到音頻生成人工智能平臺(tái)

評(píng)論