人工智能,是否有一天能與人類作曲家并駕齊驅(qū)?
近來最火的科技概念,非人工智能莫屬。人工智能,可以實(shí)現(xiàn)工廠生產(chǎn)流程的全自動化,可以代替人類駕駛汽車,可以在圍棋比賽中碾壓人類,可以將普通照片渲染成大畫家的繪畫風(fēng)格……
在作曲領(lǐng)域,人工智能也早有涉足。早在1981年,加州大學(xué)圣克魯茲分校音樂教授大衛(wèi)·科普(David Cope)就完成了音樂人工智能“音樂智能實(shí)驗(yàn)”(Experimentsin Musical Intelligence,后文統(tǒng)一縮寫為EMI)的開發(fā),最初版本的EMI能夠自動創(chuàng)作一些短小的音樂片段;游戲《古墓麗影:崛起》中,游戲的背景音樂由AI即時(shí)調(diào)整,能夠隨著游戲人物移動或場景不同隨時(shí)變化;在我國,清華大學(xué)x-lab的小伙子們開發(fā)的DeepMusic能夠通過簡單勾選風(fēng)格、樂器、情緒、時(shí)長等標(biāo)簽,自動生成個性化的音樂;百度的人工智能團(tuán)隊(duì)開發(fā)了能夠“看圖作曲”的人工智能,并現(xiàn)場演示了針對梵高《星月夜》、徐悲鴻的《奔馬圖》以及羅伯特·勞森伯格《四分之一英里畫作》等畫作進(jìn)行的配樂;產(chǎn)品化的音樂人工智能AmperMusic可以按照你選擇的曲風(fēng)、情緒等,輸出為你量身定做的主題音樂,該項(xiàng)目已獲得李嘉誠旗下維港投資(Horizons Ventures)總金額400萬美元的種子輪投資。
然而,音樂人工智能,并沒有引起人們的廣泛討論。人們會認(rèn)真考量人工智能在多大程度上能夠替代人類醫(yī)生的診斷,會導(dǎo)致多少技術(shù)工人失業(yè),可是在音樂領(lǐng)域,人工智能仿佛是一個禁忌。我曾就人工智能是否有一天能與人類作曲家并駕齊驅(qū)這個問題與不少朋友進(jìn)行過討論,絕大多數(shù)朋友的觀點(diǎn)都非常一致——絕不可能。
是的,藝術(shù)和音樂,是人類思想靈魂深處最不可接近的神圣領(lǐng)域,我們本能的否認(rèn)AI能夠成為哪怕是及格水平的作曲家,更不用提超越我們,可仔細(xì)分析我們否認(rèn)這個問題的觀點(diǎn),卻似乎并不怎么站得住腳。
總結(jié)下來,人工智能在作曲領(lǐng)域不可能超越人類的觀點(diǎn)主要有三個。其一,組成音樂的音符、節(jié)奏等基本元素,可能的排列組合是無窮的,是靠窮舉機(jī)械運(yùn)算的計(jì)算機(jī)所不可能遍歷的;其二,是人工智能不具備人類的感情,不可能創(chuàng)作出激發(fā)人類情感的音樂;其三,就算人工智能可以創(chuàng)作基礎(chǔ)的音樂旋律,可以模仿人類作曲,但計(jì)算機(jī)沒有生活經(jīng)歷,沒有喜怒哀樂,所以它無法創(chuàng)作諸如交響曲那樣的大部頭的、復(fù)雜的音樂作品。
我們逐一來看這些觀點(diǎn),首先,關(guān)于計(jì)算機(jī)只能靠窮舉進(jìn)行機(jī)械運(yùn)算這個說法,本身就是不準(zhǔn)確的。這個說法的主要來源是1997年5月11日IBM的超級電腦“深藍(lán)”戰(zhàn)勝人類國際象棋冠軍卡斯帕羅夫的那場世紀(jì)大戰(zhàn)。在那時(shí),這樣的解釋還是基本合理的,“深藍(lán)”的思考方式,相當(dāng)于一個擁有無限記憶的人背過了所有可能的棋譜,對弈時(shí)所有可能出現(xiàn)的局面它都見過,自然知道最優(yōu)策略是什么。我們可以說“深藍(lán)”的計(jì)算基本靠蠻力推演,可以說非常人工,但并沒有多么智能(極小極大策略及剪枝算法)。
可是在圍棋領(lǐng)域戰(zhàn)勝人類的AlphaGo,所采用的算法就非常不同了,雖然它也需要在之前錄入大量的棋譜,但它并不分析這些棋譜的具體意義,只是將其模式抽象為數(shù)字信息存儲(卷積神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí))。落子時(shí),阿爾法狗并不確切知道下一步怎么落子是絕對優(yōu)勢選擇,它也不關(guān)心(也沒這個能力)若干手之后局面會是個什么樣子,它只是知道把子落在哪里贏的概率會更大一些(蒙特卡洛樹搜索)。
好了,有了這些知識,我們就可以繼續(xù)討論第二個問題,即人工智能不具備人類的感情,不可能創(chuàng)作出激發(fā)人類情感的音樂這個說法了。
我們沿著剛才的觀點(diǎn)繼續(xù)思考,AlphaGo戰(zhàn)勝人類時(shí),關(guān)心的只是贏棋的概率,我們甚至可以說它根本不懂圍棋的規(guī)則,同理,在作曲領(lǐng)域,人工智能也完全不需要了解人類的情緒是什么,只需要將你喜歡的曲子輸入計(jì)算機(jī),它會自動分析抽象其中的特征,并依據(jù)這些特征生成你喜歡的音樂。
以開頭提到的音樂人工智能EMI為例。30多年來,它一直在發(fā)展進(jìn)化,如今EMI所創(chuàng)作的肖邦風(fēng)格的鋼琴曲,已經(jīng)達(dá)到以假亂真的程度,就連研究肖邦的專家也很難將其分辨出來。著名認(rèn)知神經(jīng)學(xué)家、《哥德爾、埃舍爾、巴赫: 集異璧之大成》的作者侯世達(dá)(Douglas Hofstadter)曾經(jīng)堅(jiān)定地認(rèn)為計(jì)算機(jī)不可能創(chuàng)作出優(yōu)秀的音樂作品,他曾說:“用一臺批量生產(chǎn)的、花20塊錢郵費(fèi)郵購獲得的裝滿貧乏電路的盒子,創(chuàng)作出肖邦或是巴赫活到今日寫出的曲子,這種念頭,哪怕只是想想就已經(jīng)是對人類心智深度最荒誕可恥的誤估?!?/p>
他會演奏鋼琴,非常喜歡巴赫與肖邦的音樂,自認(rèn)為“沒有什么偽造的肖邦的曲子能騙過他的耳朵”,可是聽過EMI的創(chuàng)作后(1995年),他完全分辨不出AI與肖邦的差別。他受到了極大的震撼:“如此飽含感情的音樂,怎么能從一個從未聽過一個音符、從未活過一分一秒、從未有過一絲一毫情感的程序中譜寫出來?”他也曾用這兩段音樂測試伊士曼音樂學(xué)院的講師教授,幾乎沒有人能準(zhǔn)確的分辨人工智能與肖邦的創(chuàng)作。
再來看第三個論點(diǎn),就算計(jì)算機(jī)可以生成一些短小的曲子,但它只能模仿人類作曲,且無法創(chuàng)作諸如交響曲那樣的大部頭的、復(fù)雜的音樂作品。
關(guān)于人工智能可以出色地模仿人類這點(diǎn),并沒有什么爭議。在經(jīng)過足夠的訓(xùn)練后,人工智能可以將任意圖像轉(zhuǎn)化為某位大畫家的繪畫風(fēng)格,EMI模仿肖邦的音樂創(chuàng)作,也是很好的例子??扇绻f人工智能只能模仿人類進(jìn)行創(chuàng)作,這就有些偏頗了。
AlphaGo最初的版本,就是以人類棋譜為基礎(chǔ)進(jìn)行訓(xùn)練的,這個版本表現(xiàn)并不出色,基本只能達(dá)到人類普通棋手的水準(zhǔn),距離戰(zhàn)勝職業(yè)高手,還差得遠(yuǎn)。而它實(shí)現(xiàn)圍棋能力的飛躍,恰恰是因?yàn)樗撾x了人類棋局的束縛,科學(xué)家們以人類棋局為基礎(chǔ),讓AlphaGo以左右互搏的方式,自行訓(xùn)練自己,也正是經(jīng)歷了人類對局中絕不會出現(xiàn)的盤面后,AlphaGo最終登上了圍棋冠軍的寶座。而與其對弈的人類棋手,普遍都有這樣一個評價(jià):“人類絕對不會這么下,但它下得真妙!”
所以理論上,讓人工智能自行訓(xùn)練自己,生成全新的音樂風(fēng)格,也并不是不可能的事情。事實(shí)上,已經(jīng)有人如此在做了,而且人工智能也已經(jīng)可以創(chuàng)作復(fù)雜的交響樂作品,EMI就有兩位數(shù)的交響樂創(chuàng)作;由法國人工智能團(tuán)隊(duì)開發(fā)的音樂人工智能Aiva,甚至已經(jīng)被正式吸收為法國與盧森堡作曲家協(xié)會的首位非人類會員。
盡管如此,人工智能所創(chuàng)作的交響曲作品,基本都是單樂章的交響樂,其復(fù)雜程度和規(guī)模還是遠(yuǎn)遠(yuǎn)無法與貝多芬、馬勒等人的作品相提并論。這是由于人工智能不具備如此的能力嗎?
到這里,我們可以總結(jié)一下,人工智能可以作曲,這已經(jīng)是客觀事實(shí),沒有什么爭議。而人工智能的作品是否能達(dá)到與人類作曲家并駕齊驅(qū)的程度,可以說,技術(shù)條件已經(jīng)具備,但現(xiàn)實(shí)中,卻有兩個主要的限制條件。
客觀上,對于人工智能作曲的投入,并沒有什么看得到的實(shí)在價(jià)值;而主觀上,我們也絕不愿意接受人工智能在音樂創(chuàng)作上可以與我們并肩。
我的觀點(diǎn)是,技術(shù)的高速發(fā)展,是不可抗拒的客觀事實(shí)。IBM深藍(lán)的運(yùn)算能力,放到今天,可能還不及你手中的智能手機(jī),許多我們認(rèn)為只可能被人類掌握的領(lǐng)域,正一個接一個被人工智能突破。但是,這并不代表我們要把一切都交于人工智能。
如今已不可能有人在國際象棋或是圍棋領(lǐng)域戰(zhàn)勝計(jì)算機(jī),但人類并沒有從此放棄這些游戲,因?yàn)閯儇?fù)從不是人類對弈的唯一目的,更何況從不以勝負(fù)作為判斷標(biāo)準(zhǔn)的藝術(shù)。人工智能也許能夠作曲,或許有一天也能創(chuàng)作出偉大的音樂作品,但這并不代表它能夠替代人類的創(chuàng)作。
我們與人工智能的不同,在于我們會質(zhì)疑和探索音樂與人生的意義,因?yàn)槲覀兠咳酥挥形ㄒ灰欢为?dú)特的人生,因?yàn)槲覀儠蕾p音樂。一方面,人工智能可以人類望塵莫及的效率完成各種任務(wù),但是對于計(jì)算機(jī)而言,一件任務(wù)只有初始狀態(tài)、處理過程和終止?fàn)顟B(tài),它永遠(yuǎn)不會去檢視自己完成任務(wù)的意義。
反觀人類音樂的發(fā)展,當(dāng)人們質(zhì)疑為何音樂只能是教堂中的人聲吟誦時(shí),音樂走出了中世紀(jì);讓人們思考如何才能讓音樂更富于細(xì)節(jié)和層次感時(shí),巴洛克時(shí)代來臨了;當(dāng)我們開始反思我們的音樂中充斥的精致浮華時(shí),音樂開始走向古典主義;當(dāng)我們想要通過音樂抒發(fā)自己的激情時(shí),浪漫主義到來了……
對于人類,音樂不光是音符與旋律,也是一段可以回溯的歷史,更是許多記憶與故事,這也正是音樂對于我們的意義,這一切,人工智能無法體會。
另一方面,我們每個人,都是不同的個體。我們出生、成長、成熟、衰老……我們每個人的人生經(jīng)歷都各不相同。正因如此,同一段音樂,對于不同人而言,具有不同的意義。它可以讓一些人痛哭流涕,另一些人對其卻無動于衷。音樂并不因它被創(chuàng)作出來而賦予意義,音樂由于被人欣賞才有了價(jià)值。
而對于人工智能而言,我們也應(yīng)該抱著開放的心態(tài)看待其發(fā)展。在一些場景中,人工智能是能夠做出一些有意思的突破的,比如AmperMusic所提供的個人化的音樂定制就非常有意思;我自己也曾設(shè)想過訓(xùn)練人工智能學(xué)習(xí)某位作曲家——如莫扎特或貝多芬的創(chuàng)作風(fēng)格,然后將其遷移至一些新的情境,相當(dāng)于讓這些偉大藝術(shù)家,在數(shù)字的海洋中復(fù)活,為我們繼續(xù)創(chuàng)作。
我還是有些期待某天能欣賞到這樣的人工智能的作品的,你呢?
評論