chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖神經(jīng)網(wǎng)絡(luò)也急需一個全球?qū)W者公認(rèn)的統(tǒng)一對比基準(zhǔn)

倩倩 ? 來源:雷鋒網(wǎng) ? 2020-04-17 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經(jīng)網(wǎng)絡(luò)(GNN)是當(dāng)下風(fēng)頭無兩的熱門研究話題。然而,正如計算機視覺的崛起有賴于 ImageNet 的誕生,圖神經(jīng)網(wǎng)絡(luò)也急需一個全球?qū)W者公認(rèn)的統(tǒng)一對比基準(zhǔn)。

近日,Bengio 大神帶領(lǐng)其團隊發(fā)布了新的圖神經(jīng)網(wǎng)絡(luò)對比基準(zhǔn)測試框架以及附帶的 6 個標(biāo)準(zhǔn)化數(shù)據(jù)集。大家可以開始盡情刷榜了!

時至今日,圖神經(jīng)網(wǎng)絡(luò)已經(jīng)成為了分析圖數(shù)據(jù)并且進行學(xué)習(xí)的標(biāo)準(zhǔn)工具,被成功地應(yīng)用到了各個領(lǐng)域(例如,化學(xué)、物理、社會科學(xué)、知識圖譜、推薦系統(tǒng),以及神經(jīng)科學(xué))。隨著這個領(lǐng)域的興起,識別出在不同的網(wǎng)絡(luò)尺寸下都可以泛化的架構(gòu)和關(guān)鍵機制就變得至關(guān)重要了,這讓我們可以處理更大、更復(fù)雜的數(shù)據(jù)集和領(lǐng)域。

不幸的是,在缺乏具有統(tǒng)一的實驗設(shè)置和大型數(shù)據(jù)集的標(biāo)準(zhǔn)化對比基準(zhǔn)的情況下,衡量新型 GNN 的有效性以及對模型進行比較的難度越來越大。

在本文中,Bengio 團隊提出了一種可復(fù)現(xiàn)的 GNN 對比基準(zhǔn)框架,而且為研究人員添加新數(shù)據(jù)集和模型帶來了便利。他們將這個對比基準(zhǔn)框架應(yīng)用于數(shù)學(xué)建模、計算機視覺、化學(xué)和組合問題等新穎的中型圖形數(shù)據(jù)集,從而在設(shè)計有效的 GNN 時創(chuàng)建關(guān)鍵操作。與此同時,還精確地將圖卷積,各向異性擴散,殘差連接和歸一化層作為通用構(gòu)建模塊,用于開發(fā)魯棒且可擴展的 GNN。

一、引言

在許多前人的工作的努力下,近年來,圖神經(jīng)網(wǎng)絡(luò)(GNN)已經(jīng)成為了風(fēng)口浪尖上的熱門研究話題,研究人員陸續(xù)開發(fā)出了一系列具有發(fā)展前景的方法。

隨著該領(lǐng)域的不斷發(fā)展,如何構(gòu)建強大的 GNN 成為了核心問題。什么樣的架構(gòu)、基本原則或機制是通用的、可泛化的,并且能擴展到大型圖數(shù)據(jù)集和大型圖之上呢?另一個重要的問題是:如何研究并量化理論發(fā)展對 GNN 的影響?

對比基準(zhǔn)測試為解決這些基本的問題給出了一個強大的范例。這種方法已經(jīng)被證明在推動科學(xué)進步、確定基本思想、解決特定領(lǐng)域的問題等方面對于一些科學(xué)領(lǐng)域大有助益。

近年來,大名鼎鼎的 2012 ImageNet 挑戰(zhàn)賽提供了一個很好的對比基準(zhǔn)測試數(shù)據(jù)集,它掀起了深度學(xué)習(xí)的革命。來自世界各國的研究團隊爭相開發(fā)出用于在大規(guī)模數(shù)據(jù)集上進行圖像分類的最幽默型。

由于在 ImageNet 數(shù)據(jù)集上取得的重大進展,計算機視覺研究社區(qū)已經(jīng)開辟出了一條光明的發(fā)展道路,朝著發(fā)現(xiàn)魯棒的網(wǎng)絡(luò)架構(gòu)和訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的技術(shù)邁進。

然而,設(shè)計出成功的對比基準(zhǔn)是一件極具挑戰(zhàn)的事情,它需要:設(shè)計合適的數(shù)據(jù)集、魯棒的編碼接口,以及為了實現(xiàn)公平的比較而設(shè)立的通用實驗環(huán)境,所有上述元素都需要時可復(fù)現(xiàn)的。

這樣的需求面臨著一些問題:

首先,如何定義合適的數(shù)據(jù)集?想要收集到具有代表性的、真實的大規(guī)模數(shù)據(jù)集可能是很困難的。而對于 GNN 來說,這卻是最重要的問題之一。大多數(shù)已發(fā)表的論文關(guān)注的都是非常小的數(shù)據(jù)集(例如,CORA 和 TU 數(shù)據(jù)集),在這種情況下,從統(tǒng)計及意義上說,幾乎所有的 GNN 的性能都是相同的。有些與直覺相悖的是,那些沒有考慮圖結(jié)構(gòu)的對比基線模型性能與 GNN 相當(dāng),甚至還有時要優(yōu)于 GNN。

這就對人們研發(fā)新的、更復(fù)雜的 GNN 架構(gòu)的必要性提出了疑問,甚至對使用 GNN 的必要性也提出了疑問。例如,在 Hoang&Maehara 等人以及 Chen 等人于 2019 年發(fā)表的工作中,作者分析了 GNN 中的組件的能力,從而揭示了模型在小數(shù)據(jù)集上收到的限制。他們認(rèn)為這些數(shù)據(jù)集不適合設(shè)計復(fù)雜的結(jié)構(gòu)化歸納學(xué)習(xí)框架。

GNN 領(lǐng)域面臨的另一個主要問題是如何定義通用的實驗環(huán)境。正如 Errica 等人于 2019 年發(fā)表的論文《A fair comparison of graph neural networks for graph classifification》所述,最近基于 TU 數(shù)據(jù)集完成的論文在訓(xùn)練、驗證和測試集的劃分以及評估協(xié)議方面沒有達成共識,這使得比較新思想和架構(gòu)的性能變得不公平。

人們目前尚不明確如何進行良好的數(shù)據(jù)集劃分(除了隨機劃分之外),已經(jīng)證明這樣會得到過于樂觀的預(yù)測結(jié)果(Lohr,2009)。此外,不同的超參數(shù)、損失函數(shù)和學(xué)習(xí)率計劃(learning rate schedules)使得評價架構(gòu)的新進展變得困難。

本文主要的貢獻如下:

發(fā)布了一個公開的 GNN 對比基準(zhǔn)框架,它是基于 PyTorch 和 DGL 庫開發(fā)的,并將其托管于 GitHub 上。

目標(biāo):超越目前流行的小型數(shù)據(jù)庫 CORA 和 TU,引入了 12,000~70,000 張具有 9~500 個節(jié)點的圖組成的中型數(shù)據(jù)集。數(shù)據(jù)集涉及數(shù)學(xué)建模(隨機分塊模型)、計算機視覺(超像素),組合優(yōu)化(旅行商問題)以及化學(xué)(分子溶解度)

提出的對比基準(zhǔn)框架確定了 GNN 的重要構(gòu)建模塊。圖卷積、各向異性擴散、殘差連接,以及歸一化層等技術(shù)對于設(shè)計高效的 GNN 是最有用的。

作者目的并不是對已發(fā)布的 GNN 進行排名。對于一個特定的任務(wù)來說,找到最佳的模型的計算開銷是非常高昂的(超出了相應(yīng)資源限制),它需要使用較差驗證對超參數(shù)的值進行窮舉搜索。相反,作者為所有的模型設(shè)定了一個參數(shù)變化的實驗計劃,并且分析了性能的趨勢,從而確定重要的 GNN 機制。

數(shù)值化的結(jié)果是可以完全被復(fù)現(xiàn)的。

二、對比基準(zhǔn)框架

這項工作的目的之一就是給出一系列易于使用的中型數(shù)據(jù)集,在這些數(shù)據(jù)集上,過去幾年提出的各種 GNN 架構(gòu)在性能方面表現(xiàn)出明顯且具有統(tǒng)計意義的差異。如表 1 所示,本文給出了 6 個數(shù)據(jù)集。對于其中的兩個計算機視覺數(shù)據(jù)集,作者將經(jīng)典的 MNIST 和 CIFAR10 數(shù)據(jù)集中的每張圖片使用「super-pixel」技術(shù)轉(zhuǎn)換為圖的形式(詳見原文第 5.2 節(jié))。接下來的任務(wù)就是對這些圖進行分類。

表1:已提出的基準(zhǔn)數(shù)據(jù)集統(tǒng)計表

「PATTERN」和「CLUSTER」數(shù)據(jù)集是根據(jù)隨機分塊模型生成的(詳見原文第 5.4 節(jié))。對于 PATTERN 數(shù)據(jù)集,對應(yīng)的任務(wù)是識別出預(yù)先定義好的子圖;對于 CLUSTER 數(shù)據(jù)集,對應(yīng)的任務(wù)是識別出簇。上述兩個任務(wù)都是節(jié)點分類任務(wù)。

TSP 數(shù)據(jù)集是基于旅行商問題(給定一組城市,求訪問每個城市并回到原點的可能的最短路徑)構(gòu)建的,詳見原文第 5.5 節(jié)。作者將隨機歐幾里得圖上的 TSP 作為一個邊的分類/連接預(yù)測任務(wù)來處理,其中每條邊的真實值都是由 Concorde 求解器給出的 TSP 路徑確定的。

如原文第 5.3 節(jié)所述,ZINC 是一個已經(jīng)存在的真實世界中的分子數(shù)據(jù)集。每個分子可以被轉(zhuǎn)換成圖的形式:每個原子作為一個節(jié)點,每個化學(xué)鍵作為一條邊。這里對應(yīng)的任務(wù)是對一種被稱為受限溶解度(Constrained Solubility)的分子特性進行回歸。

本文提出的每一個數(shù)據(jù)集都至少包含 12,000 個圖。這與 CORA 和經(jīng)常使用的 TU 數(shù)據(jù)集形成了鮮明的對比,這些之前的數(shù)據(jù)集往往只包含幾百個圖。

另一方面,本文提出的數(shù)據(jù)集大多數(shù)都是人造或半人造的(除了 ZINC 之外),而 CORA 和 TU 卻并非如此。因此,可以認(rèn)為這些對比基準(zhǔn)是互為補充的。

這項工作的主要動機在于,提出足夠大的數(shù)據(jù)集,從而使觀察到的不同 GNN 架構(gòu)之間的差異是具有統(tǒng)計意義的。

三、圖神經(jīng)網(wǎng)絡(luò)簡介

從最簡單的形式上來說,圖神經(jīng)網(wǎng)絡(luò)根據(jù)以下公式迭代式地從一層到另一層更新其中的節(jié)點表征:

其中

是節(jié)點 i 在第 l+1 層中的 d 維嵌入表征,

是圖中與節(jié)點 i 相連的節(jié)點集合,

則是節(jié)點 i 的度,σ 是一個非線性函數(shù),

則是一個可學(xué)習(xí)的參數(shù)。我們將這個簡單版本的圖神經(jīng)網(wǎng)絡(luò)稱為圖卷積網(wǎng)絡(luò)(GCN)。

GraphSage 和 GIN(圖同構(gòu)網(wǎng)絡(luò))提出了這種平均機制的簡單變體。在采用平均聚合版本的 GraphSage 中,公式(1)可以被改寫為:

在嵌入向量被傳給下一層之前,它會被投影到單位球之上。在 GIN 架構(gòu)中,公式(1)可以被改寫為:

其中

是可學(xué)習(xí)的參數(shù),BN 是批歸一化層。值得注意的是,為了最終的預(yù)測,GIN 在所有中間層都會使用特征。在上述所有的模型中,每個鄰居對中央節(jié)點更新的貢獻是均等的。我們將這種模型稱為各向同性的,它們將所有的邊的方向等同視之。

另一方面,高斯混合模型網(wǎng)絡(luò) MoNet,門控圖卷積網(wǎng)絡(luò) GatedGCN,以及圖注意力網(wǎng)絡(luò) GAT 提出了各向異性的更新方案:

其中,權(quán)重

是使用各種各樣的機制計算得到的(例如,GAT 中的注意力機制或 GatedGCN 中的門控機制)。

最后,還可以考慮一個層次化的圖神經(jīng)網(wǎng)絡(luò),即差分池化 DiffPool。它在層次的每一個階段以及池化的過程中都用到了 GraphSage 的公式(2)。

四、基準(zhǔn)測試實驗

在這里,我們來展示一下這篇文章所提出的開源對比基準(zhǔn)測試框架的實驗結(jié)果。

這篇工作中使用的大多數(shù) GNN 網(wǎng)絡(luò)(包括圖卷積網(wǎng)絡(luò) GCN、圖注意力網(wǎng)絡(luò) GAT、GraphSage、差分池化 DiffPool、圖同構(gòu)網(wǎng)絡(luò) GIN、高斯混合模型網(wǎng)絡(luò) MoNet),都來源于深度圖代碼庫(DGL),并且使用 PyTorch 實現(xiàn)。作者使用殘差鏈接、批歸一化,以及圖尺寸歸一化對所有 DGL 版的 GNN 實現(xiàn)進行了改進。門控圖卷積網(wǎng)絡(luò) GatedGCN 是其最終考慮使用的 GNN,并用「GatedGCN-E」代表使用了邊屬性/邊特征的版本。

此外,作者還實現(xiàn)了一個簡單的與具體圖無關(guān)的對比基線,它以相同的方式將一個多層感知機應(yīng)用于每個節(jié)點的特征向量,而與其它的節(jié)點無關(guān)??梢赃x擇在后面接上一個門控機制,從而得到門控的多層感知機對比基線。

這篇文章中使用了英偉達 1080TiGPU,在 TU、MNIST、CIFAR10、ZINC 以及 TSP 數(shù)據(jù)集上進行了實驗,并且使用英偉達 2080Ti 的 GPU 在 PATTERN 和 CLUSTER 數(shù)據(jù)集上進行了實驗。

1、在 TU 數(shù)據(jù)集上進行圖分類

第一個實驗是在 TU 數(shù)據(jù)集上進行圖分類。論文中選用了 3 個 TU 數(shù)據(jù)集,ENZYMES(訓(xùn)練集、驗證集、測試集分別包含 480、60、60 個尺寸為 2-126 的圖),DD(訓(xùn)練集、驗證集、測試集分別包含 941、118、119 個尺寸為 30-5748 的圖),以及 PROTEINS(訓(xùn)練集、驗證集、測試集分別包含 889、112、112 個尺寸為 4-620 的圖)。

實驗的數(shù)值結(jié)果如表 2 所示,從統(tǒng)計意義上說,所有的神經(jīng)網(wǎng)絡(luò)都具有差不多的性能,然而標(biāo)準(zhǔn)差卻非常大。

表 2:在標(biāo)準(zhǔn) TU 測試數(shù)據(jù)集上的模型性能(數(shù)值越高越好)。給出了兩次實驗的結(jié)果,這兩次實驗所使用的超參數(shù)是相同的,但是使用的隨機種子是不同的。作者分別展示了這兩次實驗的結(jié)果,從而說明排序和可復(fù)現(xiàn)性的差異。性能最好的結(jié)果用加粗的紅色表示,性能第二的結(jié)果用加粗的藍色表示,性能第三的結(jié)果用加粗的黑色表示。

2、使用超像素(SuperPixel) 的圖分類

在第二個實驗中,作者用到了計算機視覺領(lǐng)域流行的 MNIST 和 CIFAR10 圖像分類數(shù)據(jù)集。他們使用 SuperPixel 將原始的 MNIST 和 CIFAR10 圖像轉(zhuǎn)換為圖。

在 MNIST 數(shù)據(jù)集中,訓(xùn)練集、驗證集、測試集分別包含 55,000、5,000、10,000 個尺寸為 40-75 個節(jié)點(即 SuperPixel 的數(shù)量)的圖;在 CIFAR10 數(shù)據(jù)集中,訓(xùn)練集、驗證集、測試集分別包含 45,000、5,000、10,000 個尺寸為 85-150 個節(jié)點的圖。

對于每一個樣本,作者構(gòu)建了一個 k 最近鄰鄰接矩陣,權(quán)值

,其中 x_i,x_j 是超像素 i,j 的二維坐標(biāo),σ_x 是放縮參數(shù)(通過計算每個節(jié)點的 k 個最近鄰的平均距離 x_k 得到)。MNIST 和 CIFAR10 的超像素圖的可視化結(jié)果如圖 1 所示。

圖 1:示例圖及其超像素圖。通過 SLIC 得到的超像素圖(MNIST 最多有 75 個節(jié)點,CIFAR10 中最多有 150 個節(jié)點)是歐氏空間中得到的 8-最近鄰圖,圖中節(jié)點的顏色表示平均的像素強度。

在 MNIST 和 CIFAR 10 數(shù)據(jù)集上的圖分類結(jié)果如表 3 所示。

表 3:在標(biāo)準(zhǔn)的 MNIST 和 CIFAR10 測試數(shù)據(jù)集上的模型性能(數(shù)值越高越好)。實驗結(jié)果是根據(jù)四次使用不同的種子進行的實驗求平均得到的。紅色代表最優(yōu)的模型,紫色代表較優(yōu)模型,加粗黑色代表具有殘差連接和不具有殘差連接的模型之中的最優(yōu)模型(如果二者性能相同,則都是加粗黑色字體)。

3、在分子數(shù)據(jù)集上進行圖回歸

作者將 ZINC 分子圖數(shù)據(jù)集用于對被稱為「受限溶解度」(constrained solubility)的分子性質(zhì)進行回歸。在 ZINC 數(shù)據(jù)集中,訓(xùn)練集、驗證集、測試集分別包含 10,000、1,000、1,000 個尺寸為 9-37 個節(jié)點/原子。對于每個分子圖來說,節(jié)點特征是原子的種類,邊的特征是邊的種類。實驗結(jié)果如表 4 所示。

表 4:在標(biāo)準(zhǔn)的 ZINC 測試數(shù)據(jù)集上的模型性能(數(shù)值越低越好)。實驗結(jié)果是根據(jù)四次使用不同的種子進行的實驗求平均得到的。紅色代表最優(yōu)的模型,紫色代表較優(yōu)模型,加粗黑色代表具有殘差連接和不具有殘差連接的模型之中的最優(yōu)模型(如果二者性能相同,則都是加粗黑色字體)。

4、在隨機分塊模型(SBM)數(shù)據(jù)集上進行節(jié)點分類

在這里,作者考慮節(jié)點級的圖模式識別任務(wù),以及半監(jiān)督圖聚類任務(wù)。圖模式識別任務(wù)旨在找出一種嵌入在各種尺寸的大型圖 G 中的固定圖模式 P。對于 GNN 來說,識別出不同的圖中的模式是最基本的任務(wù)之一。模式和嵌入后的圖是通過隨機分塊模型(SBM)生成的。SBM 是一種隨機圖,它為每個節(jié)點按照以下的規(guī)則分配所屬社區(qū):對于任意兩個節(jié)點來說,如果它們從屬于同一個社區(qū)則它們被連接在一起的概率為 p,如果它們從屬于不同的社區(qū)則它們被連接在一起的概率為 q(q 的值作為噪聲水平)。

在所有的實驗中,作者生成了包含 5 個社區(qū)的圖 G,每個社區(qū)的規(guī)模在 [5, 35] 之間隨機生成。每個社區(qū)的 SBM 規(guī)則為 p = 0.5,q = 0.2,G 上的信號是通過在 3 個變量(即{0,1,2})的均勻隨機分布上采樣得到的。作者隨機生成了由 20 個節(jié)點組成的 100 個模式 P,內(nèi)部概率為 p_P = 0.5,且外部概率 q_P = 0.5(即 P 中 50% 的節(jié)點與 G 中非 P 部分相連)。P 上的信號也是在{0,1,2}中生成的隨機信號。在 PATTERN 數(shù)據(jù)集中,訓(xùn)練集、驗證集、測試集分別包括 10,000、2,000、2,000 個尺寸為 50-180 個節(jié)點的圖。當(dāng)節(jié)點從屬于 P 時輸出信號的值為 1,節(jié)點在 G 中且不從屬于 P 時輸出信號的值為 0。

半監(jiān)督聚類任務(wù)是網(wǎng)絡(luò)科學(xué)中的另一類基本任務(wù)。作者生成了 6 個 SBM 簇,其尺寸為 [5, 35] 之間隨機生成的值,概率 p = 0.55,q = 0.25。在 CLUSTER 數(shù)據(jù)集中,訓(xùn)練集、驗證集、測試集分別包括 10,000、1,000、1,000 個尺寸為 40-190 個節(jié)點的圖。作者僅僅為每個社區(qū)給出了隨機選取的單一標(biāo)簽。輸出信號被定義為聚類類別的標(biāo)簽。

表 5:在標(biāo)準(zhǔn)的 PATTERN 和 CLUSTER SBM 圖測試集上的模型性能(數(shù)值越高越好)。紅色代表最優(yōu)的模型,紫色代表較優(yōu)模型,加粗黑色代表具有殘差連接和不具有殘差連接的模型之中的最優(yōu)模型。

5、在 TSP 數(shù)據(jù)集上進行邊的分類

近年來,將機器學(xué)習(xí)用于求解 NP-hard 的組合優(yōu)化問題(COP)成為了備受關(guān)注的研究熱點。最近提出的 COP 深度學(xué)習(xí)求解器將 GNN 與經(jīng)典的圖搜索方法結(jié)合了起來,用于直接根據(jù)問題實例(表征為圖)預(yù)測近似解。在這里,作者考慮被廣泛研究的旅行商問題(TSP):給定一個二維的歐氏圖,我們需要找到一個最優(yōu)的節(jié)點順序(路徑),遍歷所有節(jié)點一次,并且邊的權(quán)重之和(路徑長度)最小。TSP 的多尺度特性使其成為了一個極具挑戰(zhàn)的圖任務(wù),它要求我們同時做到局部節(jié)點鄰居和全局圖結(jié)構(gòu)的推理。

在這里的 TSP 實驗中,作者遵循了 Li 等人于 2018 年發(fā)表的論文「Combinatorial optimization

with graph convolutional networks and guided tree search」中所描述的基于學(xué)習(xí)的 COP 求解方法,其中 GNN 是為每條邊賦予屬于/部署于某個預(yù)測解集的概率的主干架構(gòu)。接著,作者會通過圖搜索技術(shù)將概率轉(zhuǎn)換為離散決策。訓(xùn)練集、驗證集、測試集分別包含 10,000、1,000、1,000 個 TSP 實例,其中每個實例都是一個在單位正方形

中均勻采樣得到的 n 個節(jié)點位置組成的圖(

)。作者通過為每個實例均勻地采樣得到 n 個節(jié)點(

),從而生成尺寸和復(fù)雜度不一的多個 TSP 問題。

為了將主干 GNN 架構(gòu)和搜索部分的影響?yīng)毩㈤_來,作者將 TSP 作為了一個邊的二分類任務(wù),TSP 路徑中每條邊的真實值是由 Concorde 求解器得到的。為了拓展到大的實例上,作者使用了稀疏的 k = 25 的最近鄰圖,而并非使用完全圖。采樣得到的各種各樣尺寸的 TSP 實例請參閱圖 2。

圖 2:TSP 數(shù)據(jù)集中采樣得到的圖。節(jié)點用藍色表示,TSP 路徑中的真實邊用紅色表示。

五、給我們的啟示

1、在小型數(shù)據(jù)集上,與圖無關(guān)的神經(jīng)網(wǎng)絡(luò)(多層感知機)的性能與 GNN 相近

表 2 和表 3 說明對于小型的 TU 數(shù)據(jù)集和簡單的 MNIST 數(shù)據(jù)集來說,將 GNN 用在與圖無關(guān)的 MLP 對比基線上沒有明顯的性能提升。此外,MLP 有時比 GNN 的性能還要好(例如在 DD數(shù)據(jù)集上)。

2、在大型數(shù)據(jù)集上,GNN 可以提升與圖無關(guān)的神經(jīng)網(wǎng)絡(luò)性能

表 4 和表 5 顯示出,在 ZINC、PATTERN 以及 CLUSTER 數(shù)據(jù)集上,所有的 GNN 都相較于兩個 MLP 對比基線模型有很大的性能提升。表 6 說明使用了殘差連接的 GNN 模型在 TSP 數(shù)據(jù)集上的性能要優(yōu)于 MLP 對比基線。表 3 中的實驗結(jié)果說明,在 CIFAR10 數(shù)據(jù)集上差異較小,盡管最佳的 GNN 模型性能顯著優(yōu)于 MLP 模型。

3、原始的 GCN 性能較差

GCN 是最簡單的 GNN 形式。它們對節(jié)點表征的更新依賴于一個如公式(1)所述的在鄰居節(jié)點上的各向同性平均操作。Chen 等人于 2019 年發(fā)表的論文《Are Powerful Graph Neural Nets Necessary? A Dissection on Graph Classification》中對這種各向同性的性質(zhì)進行了分析,結(jié)果表明這種方法無法區(qū)分簡單的圖結(jié)構(gòu),這也解釋了 GCN 在所有的數(shù)據(jù)集上為什么性能較差。

4、在 GCN 上進行改進的新型各向同性 GNN 架構(gòu)

GraphSage 通過圖卷積層的公式(2)說明了使用中心節(jié)點信息的重要性。GIN 也在公式(3)中利用了中心節(jié)點的特征,并采用了一個與所有中間層的卷積特征相連的新的分類器層。DiffPool 考慮了一種可學(xué)習(xí)的圖池化操作,其中在每一個分辨率的層級上使用了 GraphSage。這三種各向同性的 GNN 在除了 CLUSTER 的所有數(shù)據(jù)集上都極大提升了 GCN 的性能。

5、各向異性 GNN 更加精確

諸如 GAT、MoNet、GatedGCN 等各向異性模型在除了 PATTERN 之外的所有數(shù)據(jù)集上都取得了最佳的性能。同時,作者也注意到 GatedGCN 在所有的數(shù)據(jù)集上都展現(xiàn)出了很好的性能。

與主要依賴于對鄰居節(jié)點特征的簡單求和的各向同性 GNN 不同,各向異性 GNN 采用了復(fù)雜的機制(GAT 用到了稀疏注意力機制,GatedGCN 用到了邊的門控機制),這使得它們更難得以高效地實現(xiàn)。

此外,這種 GNN 還有一個優(yōu)點,那就是它們可以顯式地使用邊的特征(例如,分子中兩個原子之間的化學(xué)鍵類型)如表 4 所示,對于 ZINC 分子數(shù)據(jù)集而言,GatedGCN-E 使用化學(xué)鍵的邊特征,相較于不使用化學(xué)鍵的 GatedGCN 極大地提升了 MAE 性能。

6、殘差連接可以提升性能

殘差連接在計算機視覺領(lǐng)域的深度學(xué)習(xí)架構(gòu)中已經(jīng)成為了一種通用的組成部分。使用殘差連接可以從兩方面幫助 GNN 提升性能:

一方面,它在深度網(wǎng)絡(luò)中限制了反向傳播過程中的梯度彌散的問題。另一方面,它使得在 GCN 和 GAT 這樣的模型中可以在卷積階段包含自節(jié)點信息,而這些模型本身并沒有顯式地使用這些信息。

表 7:對于帶有殘差連接/不帶有殘差連接的深度 GNN(最多 32 層),在 TSP 測試數(shù)據(jù)集上的模型性能(數(shù)值越高越好)。L 代表層數(shù),加粗的黑色字體代表帶有殘差連接和不帶有殘差連接的模型中最優(yōu)的一方(如果性能相同則都是加粗的黑色字體)。

圖 3:帶有殘差連接(實線)和不帶有殘差連接(虛線)的深度 GNN(最多 32 層)在 ZINC 和 CLUSTER 測試數(shù)據(jù)集上的模型性能。實驗結(jié)果是根據(jù)四次使用不同的種子進行的實驗求平均得到的。

7、歸一化層可以提升學(xué)習(xí)性能

大多數(shù)現(xiàn)實世界中的圖數(shù)據(jù)集是具有不同圖大小的不規(guī)則圖的集合。將大小不同的圖當(dāng)做一批處理,可能會導(dǎo)致節(jié)點表征處于不同的尺度。因此,對激活值進行歸一化處理可能會有助于提升學(xué)習(xí)和泛化的性能。

在試驗中,作者使用了兩個歸一化層:批量歸一化(BN)以及圖尺寸歸一化(GN)。圖尺寸歸一化是一種簡單的操作,其產(chǎn)生的節(jié)點特征 h_i 是根據(jù)圖的尺寸進行歸一化之后的結(jié)果,即

,其中 V 是節(jié)點的個數(shù)。這種歸一化層被應(yīng)用在卷積層之后、激活層之前。

表 8:有/沒有經(jīng)過批量歸一化(BN)和圖歸一化(GN)的模型在 ZINC、CIFAR10、CLUSTER 測試數(shù)據(jù)集上的性能。

實驗結(jié)果是根據(jù)四次使用不同的種子進行的實驗求平均得到的,表示為(均值±標(biāo)準(zhǔn)差),對于 ZINC 數(shù)據(jù)集來說數(shù)值越低越好,對于 CIFAR10 和 CLUSTER 數(shù)據(jù)集來說數(shù)值越高越好。加粗的黑色字體代表使用和不使用歸一化層的模型之中最優(yōu)的一方(當(dāng)二者性能相同時則都為加粗黑色字體)。

六、結(jié)語

在本文中,Begio等人提出了一種促進圖神經(jīng)網(wǎng)絡(luò)研究的對比基準(zhǔn)測試框架,并解決了實驗中的不一致性問題。他們證明了被廣為使用的小型 TU 數(shù)據(jù)集對于檢驗該領(lǐng)域的創(chuàng)新性是不合適的,并介紹了框架內(nèi)的 6 個中型數(shù)據(jù)集。

在多個針對圖的任務(wù)上進行的實驗表明:

1)當(dāng)我們使用更大的數(shù)據(jù)集時,圖結(jié)構(gòu)是很重要的;

2)作為最簡單的各向同性 GNN,圖卷積網(wǎng)絡(luò) GCN 并不能學(xué)習(xí)到復(fù)雜的圖結(jié)構(gòu);

3)自節(jié)點信息、層次、注意力機制、邊門控以及更好的讀取函數(shù)(Readout Function)是改進 GCN 的關(guān)鍵;

4)GNN 可以使用殘差連接被擴展地更深,模型性能也可以使用歸一化層得到提升。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103622
  • GNN
    GNN
    +關(guān)注

    關(guān)注

    1

    文章

    31

    瀏覽量

    6565
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)在多個方面存在顯著差異,以下是對兩者的比較: 、結(jié)構(gòu)特點 BP神經(jīng)網(wǎng)絡(luò) : BP神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 02-12 15:53 ?668次閱讀

    BP神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點分析

    BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)作為種常用的機器學(xué)習(xí)模型,具有顯著的優(yōu)點,同時存在些不容忽視的缺點。以下是對BP
    的頭像 發(fā)表于 02-12 15:36 ?922次閱讀

    什么是BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法

    BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法(Backpropagation Algorithm)是種用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的有效方法。以下是關(guān)于BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法的介紹:
    的頭像 發(fā)表于 02-12 15:18 ?768次閱讀

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系

    ),是種多層前饋神經(jīng)網(wǎng)絡(luò),它通過反向傳播算法進行訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)由輸入層、或多個隱藏層和輸出層組成,通過逐層遞減的方式調(diào)整
    的頭像 發(fā)表于 02-12 15:15 ?862次閱讀

    BP神經(jīng)網(wǎng)絡(luò)的基本原理

    BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)的基本原理涉及前向傳播和反向傳播兩核心過程。以下是關(guān)于BP神經(jīng)網(wǎng)絡(luò)基本原理的介紹: 、
    的頭像 發(fā)表于 02-12 15:13 ?858次閱讀

    深度學(xué)習(xí)入門:簡單神經(jīng)網(wǎng)絡(luò)的構(gòu)建與實現(xiàn)

    深度學(xué)習(xí)中,神經(jīng)網(wǎng)絡(luò)是核心模型。今天我們用 Python 和 NumPy 構(gòu)建簡單的神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)由多個
    的頭像 發(fā)表于 01-23 13:52 ?530次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

    在上篇文章中,我們介紹了傳統(tǒng)機器學(xué)習(xí)的基礎(chǔ)知識和多種算法。在本文中,我們會介紹人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法,供各位老師選擇。 01 人工神經(jīng)網(wǎng)絡(luò) ? 人工
    的頭像 發(fā)表于 01-09 10:24 ?1190次閱讀
    人工<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的原理和多種<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>架構(gòu)方法

    文詳解物理信息神經(jīng)網(wǎng)絡(luò)

    物理信息神經(jīng)網(wǎng)絡(luò) (PINN) 是神經(jīng)網(wǎng)絡(luò),它將微分方程描述的物理定律納入其損失函數(shù)中,以引導(dǎo)學(xué)習(xí)過程得出更符合基本物理定律的解。
    的頭像 發(fā)表于 12-05 16:50 ?8418次閱讀
    <b class='flag-5'>一</b>文詳解物理信息<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    經(jīng)典神經(jīng)網(wǎng)絡(luò)(GNNs)的基準(zhǔn)分析研究

    本文簡要介紹了經(jīng)典神經(jīng)網(wǎng)絡(luò)(GNNs)的基準(zhǔn)分析研究,發(fā)表在 NeurIPS 2024。 文章回顧了經(jīng)典 GNNs 模型在節(jié)點分類任務(wù)上的表現(xiàn),結(jié)果發(fā)現(xiàn)過去 SOTA 學(xué)習(xí)模型報告
    的頭像 發(fā)表于 11-27 09:16 ?788次閱讀
    經(jīng)典<b class='flag-5'>圖</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>(GNNs)的<b class='flag-5'>基準(zhǔn)</b>分析研究

    卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的比較

    神經(jīng)網(wǎng)絡(luò)稱為全連接神經(jīng)網(wǎng)絡(luò)(Fully Connected Neural Networks,F(xiàn)CNs),其特點是每層的每個神經(jīng)元都與下
    的頭像 發(fā)表于 11-15 14:53 ?1872次閱讀

    RNN模型與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的區(qū)別

    神經(jīng)網(wǎng)絡(luò)是機器學(xué)習(xí)領(lǐng)域中的種強大工具,它們能夠模擬人腦處理信息的方式。隨著技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)的類型在不斷增加,其中循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN
    的頭像 發(fā)表于 11-15 09:42 ?1128次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與工作機制

    的結(jié)構(gòu)與工作機制的介紹: 、LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)主要包括以下幾個部分: 記憶單元(Memory Cell) : 記憶單元是LSTM網(wǎng)絡(luò)的核心,負(fù)責(zé)在整個序列
    的頭像 發(fā)表于 11-13 10:05 ?1631次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)RNN的區(qū)別

    神經(jīng)網(wǎng)絡(luò)(RNN) RNN的基本結(jié)構(gòu) RNN是種特殊的神經(jīng)網(wǎng)絡(luò),它能夠處理序列數(shù)據(jù)。在RNN中,每個時間步的輸入都會通過循環(huán)結(jié)構(gòu)傳遞到
    的頭像 發(fā)表于 11-13 09:58 ?1214次閱讀

    關(guān)于卷積神經(jīng)網(wǎng)絡(luò),這些概念你厘清了么~

    這個小型網(wǎng)絡(luò),用于描述網(wǎng)絡(luò)的方程中具有32偏置和32權(quán)重。 CIFAR神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 10-24 13:56

    如何構(gòu)建多層神經(jīng)網(wǎng)絡(luò)

    構(gòu)建多層神經(jīng)網(wǎng)絡(luò)(MLP, Multi-Layer Perceptron)模型是在機器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域廣泛使用的技術(shù),尤其在處理分類和回歸問題時。在本文中,我們將深入探討如何從頭開始構(gòu)建
    的頭像 發(fā)表于 07-19 17:19 ?1569次閱讀