AI 創(chuàng)作音樂越來越熱門。
剛剛,OpenAI 發(fā)布了其 AI 音樂創(chuàng)作的深度神經(jīng)網(wǎng)絡(luò)—MuseNet,可以使用 10 種不同樂器、風格如鄉(xiāng)村樂、莫扎特、披頭士樂隊等,生成出 4 分鐘的音樂。
OpenAI 博客最新發(fā)布文章指出,MuseNet 不是依靠人類明確地對音樂進行編程,而是通過學習預(yù)測 token 來學習和聲、節(jié)奏、風格的模式,他們從許多來源收集 MuseNet 的訓練數(shù)據(jù),像是 ClassicalArchives、BitMidi 網(wǎng)站上的文件、MAESTRO 數(shù)據(jù)集,還有爵士、流行、非洲、印度和阿拉伯風格的音樂,總共利用了數(shù)十萬個 MIDI 文件。
OpenAI 也指出,MuseNet 使用與 GPT-2 相同的通用無監(jiān)督技術(shù),GPT-2 為先前 OpenAI 提出的一個大規(guī)模 Transformer 模型,訓練 AI 可預(yù)測序列中的下一個 token,包括音頻和文本,用在 MuseNet 上則是給定一組音符后,要求 AI 預(yù)測后面會出現(xiàn)的音符。另外,MuseNet 使用 Sparse Transformer 的重新計算和優(yōu)化核來訓練一個具有 24 個注意力頭(attention head)的 72 層網(wǎng)絡(luò),其全部注意力都放在 4096 個 token 的語境中。
當 MuseNet 知道許多不同的風格之后,就能混合生成新的音樂,舉例來說,提供機器肖邦夜曲(Chopin Nocturne)的前 6 個音符,但是,要求機器生成一段流行樂,并要有鋼琴、鼓、bass 和吉他,而機器生成的音樂就完美融合了肖邦和 Bon Jovi 兩種風格。
圖| MuseNet 音樂生成神經(jīng)網(wǎng)絡(luò)(來源:OpenAI)
之前 OpenAI 提出的 GPT-2,使用近 40 GB 的網(wǎng)頁文字訓練而成,主要具備了生成文本、預(yù)測下一個文字的能力,例如只給機器一段文字,就會因應(yīng)前后文的風格創(chuàng)造內(nèi)容、編寫故事,但因為它生成的內(nèi)容有條有理,仿真技術(shù)高,反而讓外界擔心助長假新聞、網(wǎng)絡(luò)假消息的泛濫,在考量該技術(shù)可能遭惡意使用后,OpenAI 決定不放出訓練好的模型,只公開一小部分模型和范例。
現(xiàn)在用在音樂創(chuàng)作上,可能引起的爭議相對小,倒是為 GPT-2 找到了不錯的應(yīng)用場景。
另外,OpenAI 剛剛還在 Twitch 上舉辦了 MuseNet 實驗音樂會,并預(yù)計在 5 月中旬放出該音樂轉(zhuǎn)換器的工具——MuseNet共同作曲家(MuseNet-powered co-composer),讓一般大眾和音樂家用來創(chuàng)作。
MuseNet 共同作曲家有幾種模式:簡單模式下,用戶會聽到已經(jīng)預(yù)先生成的隨機樣本,然后選擇一個作曲家或風格,就可以開始生成音樂;高級模式,則可讓用戶有更多的選擇,像是選風格、樂器等,打造全新的音樂作品。
圖|MuseNet 在 Twitch 上舉辦一場音樂會(來源:Twitch)
OpenAI 研究人員 Christine Payne 指出,MuseNet 仍有局限性,因為它是通過計算所有可能的音符和樂器的概率來產(chǎn)生每個音符,所以偶爾會做出不和諧的選擇,做出奇怪的配對,例如把肖邦風格配上 bass 和鼓。
今年 3 月,谷歌為慶祝知名音樂家巴赫的生日,在 Google Doodle 放了一個小游戲,用戶在 Doodle 按下音符及節(jié)奏,就會以巴赫的風格演奏用戶創(chuàng)作的作品。這是使用人工智能作曲的另一個案例。
不僅谷歌、OpenAI,唱片業(yè)、音樂人本身也都在探究 AI 的應(yīng)用,在 MuseNet 于 Twitch 上舉辦音樂會之前,音樂技術(shù)專家 CJ Carr 和 Zack Zukowski 就在 YouTube 頻道上播放重金屬音樂,這些死亡金屬串流音樂就是由他們開發(fā)的 AI 樂團 Dadabots 所生成的,而且 24 小時不間斷。他們使用加拿大的死亡金屬樂團 Archspire 的樣本訓練 SampleRNN 神經(jīng)網(wǎng)絡(luò),進而可自動生成重金屬音樂。
毫無疑問,人工智能將持續(xù)融入創(chuàng)意音樂領(lǐng)域。
圖|重金屬音樂不間斷播放,背后其實是一個 AI 樂團(來源:YouTube)
-
轉(zhuǎn)換器
+關(guān)注
關(guān)注
27文章
9418瀏覽量
156342 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4838瀏覽量
107756 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1236瀏覽量
26191
原文標題:OpenAI發(fā)布音樂生成神經(jīng)網(wǎng)絡(luò) MuseNet,可創(chuàng)作4分鐘音樂,剛剛還辦了場音樂會
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
神經(jīng)網(wǎng)絡(luò)的初步認識
NMSIS神經(jīng)網(wǎng)絡(luò)庫使用介紹
在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗
CICC2033神經(jīng)網(wǎng)絡(luò)部署相關(guān)操作
液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN):時間連續(xù)性與動態(tài)適應(yīng)性的神經(jīng)網(wǎng)絡(luò)
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經(jīng)形態(tài)計算、類腦芯片
神經(jīng)網(wǎng)絡(luò)的并行計算與加速技術(shù)
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構(gòu)
如何在機器視覺中部署深度學習神經(jīng)網(wǎng)絡(luò)
無刷電機小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測方法的研究
神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)在電機故障診斷中的應(yīng)用
神經(jīng)網(wǎng)絡(luò)RAS在異步電機轉(zhuǎn)速估計中的仿真研究
AI神經(jīng)網(wǎng)絡(luò)降噪算法在語音通話產(chǎn)品中的應(yīng)用優(yōu)勢與前景分析
OpenAI發(fā)布了其AI音樂創(chuàng)作的深度神經(jīng)網(wǎng)絡(luò)—MuseNet
評論