這一領(lǐng)域在其發(fā)展方向和原因上存在分歧。
自上世紀(jì)50年代以來(lái),人工智能一再言過(guò)其實(shí),卻未能兌現(xiàn)其承諾。盡管近年來(lái),由于深度學(xué)習(xí),人工智能出現(xiàn)了令人難以置信的飛躍,但今天的人工智能仍然很狹隘:它在面對(duì)攻擊時(shí)很脆弱,不能泛化以適應(yīng)不斷變化的環(huán)境,而且充滿(mǎn)偏見(jiàn)。所有這些挑戰(zhàn)使得該技術(shù)難以被信任,并限制了其造福社會(huì)的潛力。
3月26日,在《麻省理工學(xué)院技術(shù)評(píng)論》(MIT Technology Review)的年度EmTech數(shù)字活動(dòng)上,兩位人工智能領(lǐng)域的杰出人物走上虛擬舞臺(tái),討論該領(lǐng)域如何克服這些問(wèn)題。
加里·馬庫(kù)斯(Gary Marcus),紐約大學(xué)名譽(yù)教授,Robust.AI公司創(chuàng)始人兼CEO,是一位著名的深度學(xué)習(xí)批評(píng)家。在去年出版的《重啟人工智能》(Rebooting AI)一書(shū)中,他認(rèn)為人工智能的缺陷是這種技術(shù)固有的。因此,他認(rèn)為,研究人員必須超越深度學(xué)習(xí)的范疇,將其與經(jīng)典人工智能系統(tǒng)結(jié)合起來(lái)。經(jīng)典人工智能系統(tǒng)可以編碼知識(shí),并具有推理能力。
丹尼·蘭格(Danny Lange)是Unity負(fù)責(zé)人工智能和機(jī)器學(xué)習(xí)的副總裁,他完全屬于深度學(xué)習(xí)陣營(yíng)。他的職業(yè)生涯建立在這項(xiàng)技術(shù)的前景和潛力上,曾擔(dān)任優(yōu)步(Uber)的機(jī)器學(xué)習(xí)主管、亞馬遜(Amazon)的機(jī)器學(xué)習(xí)總經(jīng)理,以及微軟(Microsoft)專(zhuān)注于大規(guī)模機(jī)器學(xué)習(xí)的產(chǎn)品主管。在Unity,他現(xiàn)在幫助DeepMind和OpenAI等實(shí)驗(yàn)室構(gòu)建虛擬訓(xùn)練環(huán)境,教它們的算法感知世界。
活動(dòng)期間,每位演講者都做了一個(gè)簡(jiǎn)短的陳述,然后坐下來(lái)進(jìn)行小組討論。他們表達(dá)的分歧反映了該領(lǐng)域內(nèi)的許多沖突,突顯出一場(chǎng)持久的理念之戰(zhàn)對(duì)技術(shù)的影響有多么強(qiáng)大,而該技術(shù)未來(lái)的發(fā)展方向又有多么不確定。
為了清楚起見(jiàn),下面對(duì)他們的小組討論進(jìn)行了精簡(jiǎn)和略加編輯。
加里,你利用你在神經(jīng)科學(xué)和心理學(xué)方面的專(zhuān)長(zhǎng)找出了人工智能目前缺失的東西。你認(rèn)為是什么原因使得傳統(tǒng)的人工智能系統(tǒng)適合與深度學(xué)習(xí)相結(jié)合呢?
加里·馬庫(kù)斯:我要說(shuō)的第一件事是,我們可能需要比深度學(xué)習(xí)和傳統(tǒng)人工智能更復(fù)雜的混合體。我們至少需要它。但可能有一大堆事情我們甚至還沒(méi)有想到過(guò)。我們需要保持開(kāi)放的心態(tài)。
為什么要把經(jīng)典的人工智能加入其中呢?嗯,我們?cè)谑澜缟细鶕?jù)我們的知識(shí)進(jìn)行各種推理。深度學(xué)習(xí)并不能代表這一點(diǎn)。在這些系統(tǒng)中,沒(méi)有辦法來(lái)表示一個(gè)球是什么,一個(gè)瓶子是什么,以及這些東西對(duì)彼此有什么影響。所以結(jié)果看起來(lái)很好,但它們通常不是很普遍。
而這便是經(jīng)典AI所擅長(zhǎng)的。例如,它可以將一個(gè)句子解析為它的語(yǔ)義表示,或者了解世界上正在發(fā)生的事情,然后做出推斷。但經(jīng)典AI也有自己的問(wèn)題:它通常所能覆蓋的范圍并不夠,因?yàn)樗刑嗟娜藶槎x等。但至少在原則上,這是我們所知道的唯一的方法,來(lái)建立一個(gè)系統(tǒng),它可以對(duì)抽象的知識(shí)進(jìn)行邏輯推理和歸納推理。這不意味著它是絕對(duì)正確的,但它是迄今為止我們擁有的最好的。
還有很多心理學(xué)上的證據(jù)表明人們可以做某種程度的象征性表征。在我之前的生活中,作為一個(gè)認(rèn)知發(fā)展學(xué)領(lǐng)域的人,我對(duì)7個(gè)月大的嬰兒做了實(shí)驗(yàn),結(jié)果表明這些嬰兒可以概括符號(hào)知識(shí)。如果一個(gè)7個(gè)月大的嬰兒就能做到這一點(diǎn),那么為什么我們要摒棄我們先天的優(yōu)勢(shì)來(lái)構(gòu)建人工智能呢?
你見(jiàn)過(guò)成功地將深度學(xué)習(xí)和經(jīng)典人工智能結(jié)合起來(lái)的項(xiàng)目嗎?
GM:在我寫(xiě)的一篇名為《人工智能的下一個(gè)十年》[1]的文章中,我列出了最近20個(gè)不同的項(xiàng)目,這些項(xiàng)目試圖將一些有深度學(xué)習(xí)和一些表征知識(shí)的混合模型組合在一起。一個(gè)大家都知道的例子是谷歌搜索。當(dāng)你輸入一個(gè)搜索查詢(xún),有一些經(jīng)典的人工智能試圖消除有歧義的詞。它使用谷歌知識(shí)圖譜試圖找出當(dāng)你談?wù)摗鞍屠琛睍r(shí),你是在談?wù)撆聋愃瓜栴D,巴黎,德克薩斯,還是巴黎,法國(guó)。然后,它使用深度學(xué)習(xí)來(lái)做一些其他的事情——例如,使用BERT模型[2]來(lái)查找同義詞。當(dāng)然,谷歌搜索并不是我們最終希望實(shí)現(xiàn)的人工智能,但它是一個(gè)非??煽康淖C據(jù),證明這不是一個(gè)不可能的夢(mèng)想。
丹尼,你同意我們應(yīng)該研究這些混合模型嗎?
丹尼·蘭格:不,我不同意。我對(duì)經(jīng)典人工智能的看法是,它試圖在非常深刻的意義上模仿人類(lèi)的大腦。這讓我想起了,你知道,在18世紀(jì),如果你想要更快的交通,你會(huì)建造機(jī)械馬而不是發(fā)明內(nèi)燃機(jī)。所以我非常懷疑試圖通過(guò)模仿人類(lèi)大腦來(lái)解決人工智能的問(wèn)題。
深度學(xué)習(xí)不一定是靈丹妙藥,但如果你給它提供足夠的數(shù)據(jù),并且你有正確的神經(jīng)網(wǎng)絡(luò)架構(gòu),它就能夠?qū)W習(xí)我們?nèi)祟?lèi)無(wú)法理解的抽象概念,這使系統(tǒng)在解決眾多廣泛任務(wù)時(shí)非常有效。
聽(tīng)起來(lái)你們倆對(duì)人工智能的目標(biāo)有分歧。
GM:有點(diǎn)諷刺的是,去年12月,我與約舒亞·本吉?dú)W(yobengio)進(jìn)行了一場(chǎng)辯論。本吉?dú)W說(shuō),深度學(xué)習(xí)必須以神經(jīng)學(xué)為基礎(chǔ)。所以我從深度學(xué)習(xí)中聽(tīng)到了兩個(gè)相反的極端。這有點(diǎn)奇怪,我認(rèn)為我們不應(yīng)該對(duì)這些論點(diǎn)太當(dāng)真。
相反,我們應(yīng)該說(shuō):“經(jīng)典AI中的符號(hào)知識(shí)能幫助到我們嗎?”答案絕對(duì)是肯定的。世界上幾乎所有的軟件都是建立在符號(hào)基礎(chǔ)上的。然后你不得不說(shuō),“從經(jīng)驗(yàn)上講,深度學(xué)習(xí)的東西能達(dá)到我們想要的效果嗎?”“到目前為止,問(wèn)題是它沒(méi)有模型。Vicarious(一家以人工智能為動(dòng)力的工業(yè)機(jī)器人初創(chuàng)公司)展示了一款非常受歡迎的雅達(dá)利(Atari)游戲?qū)W習(xí)系統(tǒng)[3]。但是當(dāng)Vicarious將球拍移動(dòng)了幾個(gè)像素后,整個(gè)游戲就崩潰了,因?yàn)樗膶W(xué)習(xí)水平實(shí)在是太淺了。它沒(méi)有球拍、球、磚頭的概念。而符號(hào)算法可以很容易地彌補(bǔ)這些缺陷。
研究人類(lèi)的原因是,人類(lèi)在某些方面做得比深度學(xué)習(xí)系統(tǒng)好得多。這并不意味著人類(lèi)將最終成為正確的模型。我們想要的系統(tǒng)有一些電腦的屬性,也有一些從人那里學(xué)來(lái)的屬性。我們不希望因?yàn)槿说挠洃浟Σ钏匀斯ぶ悄芟到y(tǒng)記憶力也差。但是,由于人是自然界中唯一能夠?qū)δ臣庐a(chǎn)生深刻理解的模型——確切地說(shuō),是我們所擁有的唯一模型——我們需要認(rèn)真對(duì)待這個(gè)模型。
DL:對(duì),世界上的編程語(yǔ)言都是以符號(hào)為基礎(chǔ)的,這是事實(shí),因?yàn)樗鼈兪菫槿祟?lèi)實(shí)現(xiàn)自己的想法而設(shè)計(jì)的。
深度學(xué)習(xí)不是人腦的復(fù)制。也許你可以說(shuō)它是受到了神經(jīng)學(xué)的啟發(fā),但它只是一個(gè)軟件。我們還沒(méi)有真正深入到深度學(xué)習(xí)。到目前為止,我們只有有限的訓(xùn)練數(shù)據(jù)。我們有有限的結(jié)構(gòu)和有限的計(jì)算能力。但關(guān)鍵是深度學(xué)習(xí)的學(xué)習(xí)概念,學(xué)習(xí)特征。這不是人類(lèi)設(shè)計(jì)的東西。我認(rèn)為Gary的方法和我的方法最大的區(qū)別是人類(lèi)工程師是給系統(tǒng)提供智能還是系統(tǒng)自己學(xué)習(xí)智能。
丹尼,你提到由于數(shù)據(jù)和計(jì)算的局限性,我們還沒(méi)有真正看到深度學(xué)習(xí)的潛力。既然深度學(xué)習(xí)效率如此之低,我們難道不應(yīng)該開(kāi)發(fā)新技術(shù)嗎?為了開(kāi)發(fā)新的深度學(xué)習(xí)能力,我們不得不大幅增加計(jì)算能力。
DLs:深度學(xué)習(xí)的問(wèn)題之一是,到目前為止,它實(shí)際上是基于一種傳統(tǒng)的方法:你生成一個(gè)大的訓(xùn)練數(shù)據(jù)集,然后把它輸入。一件可以真正提高深度學(xué)習(xí)的事情是有一個(gè)積極的學(xué)習(xí)過(guò)程,在這個(gè)過(guò)程中,網(wǎng)絡(luò)被訓(xùn)練來(lái)優(yōu)化訓(xùn)練數(shù)據(jù)。你不需要輸入大量的數(shù)據(jù)來(lái)改善學(xué)習(xí)過(guò)程??梢圆粩嗾{(diào)整訓(xùn)練數(shù)據(jù),以針對(duì)特定的領(lǐng)域。
加里,你指出了深度學(xué)習(xí)在面對(duì)偏見(jiàn)和對(duì)抗性攻擊時(shí)的弱點(diǎn)。丹尼,你提到了合成數(shù)據(jù)是解決這個(gè)問(wèn)題的辦法,因?yàn)椤皼](méi)有偏見(jiàn)”,你可以運(yùn)行數(shù)百萬(wàn)次模擬,以消除對(duì)手的弱點(diǎn)。你們對(duì)此有何回應(yīng)?
GM:僅僅依靠數(shù)據(jù)還不能解決問(wèn)題。合成數(shù)據(jù)無(wú)法幫助解決貸款中的偏見(jiàn)或工作面試中的偏見(jiàn)等問(wèn)題。真正的問(wèn)題是,這些制度有一種傾向,會(huì)使那些由于歷史原因而存在的偏見(jiàn)永久化。與建立足夠復(fù)雜的系統(tǒng)來(lái)理解我們?cè)噲D取代的文化偏見(jiàn)相比,人工數(shù)據(jù)顯然不是解決方案。
對(duì)抗性攻擊是另一回事。數(shù)據(jù)可能有助于解決其中的一些問(wèn)題,但到目前為止,我們還沒(méi)有真正消除許多不同類(lèi)型的對(duì)抗性攻擊。之前我的文章中有提到棒球它被描述為濃縮咖啡。如果有人事先想好要在模擬中用意式濃縮咖啡做棒球,然后仔細(xì)地給它們貼上標(biāo)簽,那很好。總會(huì)有一些沒(méi)人想到的情況。一個(gè)純粹由數(shù)據(jù)驅(qū)動(dòng)的系統(tǒng)將繼續(xù)受到攻擊。
DL:不管你做什么,現(xiàn)實(shí)世界的數(shù)據(jù)都是有偏見(jiàn)的。你在特定的環(huán)境中收集數(shù)據(jù),比如自動(dòng)駕駛汽車(chē),可能有90%的成年人和10%的兒童在街上。這是正態(tài)分布。但是一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)需要訓(xùn)練足夠多的數(shù)據(jù)以避免撞上成人或兒童中的任何一個(gè)。有了合成數(shù)據(jù)(模擬數(shù)據(jù)),如果你小心的話,基本上就能平衡和避免偏差。這并不意味著你不能制造新的偏見(jiàn)。你得小心點(diǎn)。當(dāng)然,還解決了隱私問(wèn)題,因?yàn)槿魏斡?xùn)練數(shù)據(jù)中都沒(méi)有真實(shí)的人或真實(shí)的孩子。
至于對(duì)抗性的例子,它們的問(wèn)題是,它們基本上是在弱計(jì)算機(jī)視覺(jué)模型的基礎(chǔ)上開(kāi)發(fā)的——這些模型已經(jīng)訓(xùn)練了1000萬(wàn)或2000萬(wàn)張圖像,比如來(lái)自ImageNet的圖像。這遠(yuǎn)遠(yuǎn)不足以概括一個(gè)模型。我們需要大量的數(shù)據(jù)集和大量的領(lǐng)域隨機(jī)化來(lái)概括這些計(jì)算機(jī)視覺(jué)模型,這樣它們就不會(huì)被愚弄。
你對(duì)人工智能的未來(lái)最感興趣的是什么?
GM:去年確實(shí)出現(xiàn)了向混合動(dòng)力汽車(chē)發(fā)展的趨勢(shì)。人們正在探索以前沒(méi)有的新事物,這很令人興奮。
DL:我認(rèn)為這是一個(gè)多模型系統(tǒng),是由許多不同的感知和行為模型組成的系統(tǒng),用來(lái)解決真正復(fù)雜的任務(wù)。
責(zé)任編輯:Ct
評(píng)論