chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Stability AI推出Stable audio的文本到音頻生成人工智能平臺(tái)

IEEE電氣電子工程師 ? 來(lái)源:IEEE電氣電子工程師 ? 2023-09-20 10:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Stability AI是一家主要以人工智能生成的視覺(jué)效果而聞名的公司,它推出了一個(gè)名為Stable audio的文本到音頻生成人工智能平臺(tái)。

Stable Audio使用擴(kuò)散模型,與該公司更受歡迎的圖像平臺(tái)Stable diffusion的AI模型相同,但使用音頻而非圖像進(jìn)行訓(xùn)練。用戶可以使用它為任何項(xiàng)目生成歌曲或背景音頻。

音頻擴(kuò)散模型傾向于生成固定長(zhǎng)度的音頻,這對(duì)音樂(lè)制作來(lái)說(shuō)很糟糕,因?yàn)楦枨拈L(zhǎng)度可能不同。Stability AI的新平臺(tái)允許用戶發(fā)出不同長(zhǎng)度的聲音,要求公司對(duì)音樂(lè)進(jìn)行訓(xùn)練,并在歌曲的開始和結(jié)束時(shí)間周圍添加文本元數(shù)據(jù)。

同時(shí),它可以實(shí)現(xiàn)實(shí)時(shí)的音頻生成,無(wú)需等待長(zhǎng)時(shí)間的渲染過(guò)程。Stability AI 宣稱,Stable Audio 模型可以在一秒內(nèi)渲染出 95 秒的立體聲音頻,并且只需要一個(gè) NVIDIA A100 GPU。

并且,Stable Audio是一個(gè)開源的項(xiàng)目,任何人都可以免費(fèi)使用和修改。Stability AI 希望通過(guò)開源的方式促進(jìn) AI 領(lǐng)域的創(chuàng)新和發(fā)展,并讓更多人享受到 AI 技術(shù)帶來(lái)的便利和樂(lè)趣。

該公司在一份聲明中表示:“Stable Audio代表了Stability AI生成音頻研究實(shí)驗(yàn)室Harmonai的尖端音頻生成研究。我們會(huì)繼續(xù)改進(jìn)我們的模型架構(gòu)、數(shù)據(jù)集和訓(xùn)練程序,以提高輸出質(zhì)量、可控性、推理速度和輸出長(zhǎng)度?!?/p>

文本到音頻的生成并不是什么新鮮事,因?yàn)樯扇斯ぶ悄茴I(lǐng)域的其他大牌一直在玩弄這個(gè)概念。Meta于8月發(fā)布了AudioCraft,這是一套生成的人工智能模型,有助于根據(jù)提示創(chuàng)建聽(tīng)起來(lái)自然的ERM、聲音和音樂(lè)。到目前為止,它只提供給研究人員和一些音頻專業(yè)人士。谷歌的MusicLM也可以讓人們產(chǎn)生聲音,但只對(duì)研究人員開放。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 音頻
    +關(guān)注

    關(guān)注

    31

    文章

    3161

    瀏覽量

    85198
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39125

    瀏覽量

    299750
  • 人工智能
    +關(guān)注

    關(guān)注

    1814

    文章

    49967

    瀏覽量

    263698
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3694

    瀏覽量

    51953
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1235

    瀏覽量

    26116

原文標(biāo)題:Stability AI發(fā)布AI音頻平臺(tái)Stable Audio

文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    生成人工智能會(huì)讓自動(dòng)駕駛更靈活嗎?

    [首發(fā)于智駕最前沿微信公眾號(hào)]每當(dāng)提到“人工智能”(AI),很多人第一反應(yīng)就是想到它能實(shí)現(xiàn)識(shí)別圖片、聽(tīng)懂語(yǔ)音、做出判斷、推薦內(nèi)容等任務(wù)。但在AI領(lǐng)域,還有一個(gè)更細(xì)致的分類,那便是生成
    的頭像 發(fā)表于 12-23 10:05 ?416次閱讀
    <b class='flag-5'>生成</b>式<b class='flag-5'>人工智能</b>會(huì)讓自動(dòng)駕駛更靈活嗎?

    全球首個(gè)動(dòng)漫專屬AI頻生成平臺(tái)Animon,國(guó)內(nèi)版&quot;萌動(dòng)AI&quot;正式發(fā)布

    平臺(tái)Animon正式推出國(guó)內(nèi)版產(chǎn)品——"萌動(dòng)AI",為數(shù)億創(chuàng)作者帶來(lái)視覺(jué)革命。該平臺(tái)由專業(yè)的動(dòng)漫制作團(tuán)隊(duì)和頂尖的AI技術(shù)團(tuán)隊(duì)聯(lián)合打造,并將專
    的頭像 發(fā)表于 09-25 12:33 ?792次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對(duì)開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    應(yīng)用場(chǎng)景。從數(shù)據(jù)采集,模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實(shí)訓(xùn),讓你深度體驗(yàn)AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習(xí)需求 對(duì)于高校教學(xué)或者技術(shù)學(xué)習(xí)來(lái)說(shuō),課程覆蓋的廣度
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    應(yīng)用場(chǎng)景。從數(shù)據(jù)采集,模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實(shí)訓(xùn),讓你深度體驗(yàn)AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習(xí)需求 對(duì)于高校教學(xué)或者技術(shù)學(xué)習(xí)來(lái)說(shuō),課程覆蓋的廣度
    發(fā)表于 08-07 14:23

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    生成人工智能認(rèn)證:重構(gòu)AI時(shí)代的人才培養(yǎng)與職業(yè)躍遷路徑

    ,恰似一座連接技術(shù)前沿與個(gè)體成長(zhǎng)的橋梁,既承載著時(shí)代對(duì)人才的迫切需求,也指向著未來(lái)職場(chǎng)的核心競(jìng)爭(zhēng)力。 一、技術(shù)革命的雙重性:賦能與失衡并存 生成人工智能的突破性,在于其首次讓機(jī)器具備了“無(wú)中生有”的創(chuàng)造力。從文本生成
    的頭像 發(fā)表于 05-23 09:29 ?760次閱讀

    生成人工智能認(rèn)證:重塑AI時(shí)代職業(yè)版圖的鑰匙

    在科技浪潮席卷全球的今天,人工智能AI)已從科幻概念進(jìn)化為驅(qū)動(dòng)社會(huì)變革的核心力量。其中,生成人工智能(Generative AI)作為技
    的頭像 發(fā)表于 05-23 09:18 ?602次閱讀

    生成人工智能認(rèn)證:重塑AI職業(yè)生態(tài)的底層邏輯

    人工智能技術(shù)滲透至社會(huì)毛細(xì)血管的今天,生成人工智能(Generative AI)的崛起正在改寫人類與技術(shù)的協(xié)作范式。從ChatGPT引爆的全球熱潮,
    的頭像 發(fā)表于 05-23 09:17 ?728次閱讀

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個(gè)全新八核擁有超強(qiáng)性能的人工智能
    發(fā)表于 04-23 10:55

    Arm與Stability AI攜手合作加快文本轉(zhuǎn)音頻的響應(yīng)速度

    ”,幾秒鐘后,你的設(shè)備就會(huì)為你生成合適的聲音,甚至無(wú)需聯(lián)網(wǎng)就可實(shí)現(xiàn)。得益于 Arm 和 Stability AI 的新合作,這種完全在端側(cè)直接生成
    的頭像 發(fā)表于 03-25 15:54 ?747次閱讀

    AI人工智能隱私保護(hù)怎么樣

    在當(dāng)今科技飛速發(fā)展的時(shí)代,AI人工智能已經(jīng)深入到我們生活的方方面面,從醫(yī)療診斷交通調(diào)度,從教育輔助娛樂(lè)互動(dòng),其影響力無(wú)處不在。然而,隨著AI
    的頭像 發(fā)表于 03-11 09:46 ?1125次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>人工智能</b>隱私保護(hù)怎么樣

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    用戶的視頻生成請(qǐng)求和展示生成的視頻結(jié)果。 將前端界面與語(yǔ)聚AI平臺(tái)中的AI助手進(jìn)行集成,確保前端能夠正確地調(diào)用
    發(fā)表于 03-05 19:52

    我國(guó)生成人工智能的發(fā)展現(xiàn)狀與趨勢(shì)

    作為信息化、數(shù)字化、智能化的新型技術(shù)基座,生成人工智能對(duì)于提升國(guó)家戰(zhàn)略地位與國(guó)際競(jìng)爭(zhēng)力具有重要意義。2022年11月以來(lái),隨著以ChatGPT為代表的大語(yǔ)言模型迅速發(fā)展,生成
    的頭像 發(fā)表于 02-08 11:31 ?2335次閱讀

    字節(jié)跳動(dòng)即將推出多模態(tài)視頻生成模型OmniHuman

    一條完整的AI視頻。 據(jù)即夢(mèng)AI相關(guān)負(fù)責(zé)人透露,OmniHuman模型在研發(fā)過(guò)程中融入了前沿的人工智能技術(shù),通過(guò)復(fù)雜的算法和深度學(xué)習(xí)機(jī)制,實(shí)現(xiàn)了圖片與音頻的精準(zhǔn)匹配和視頻內(nèi)容的
    的頭像 發(fā)表于 02-08 10:53 ?1278次閱讀