德國研究者提出最新幾何深度學習擴展庫 PyTorch Geometric (PyG),具有快速、易用的優(yōu)勢,使得實現(xiàn)圖神經(jīng)網(wǎng)絡變得非常容易。作者開源了他們的方法,并提供教程和實例。
過去十年來,深度學習方法(例如卷積神經(jīng)網(wǎng)絡和遞歸神經(jīng)網(wǎng)絡)在許多領域取得了前所未有的成就,例如計算機視覺和語音識別。
研究者主要將深度學習方法應用于歐氏結構數(shù)據(jù)(Euclidean domains),但在許多重要的應用領域,如生物學、物理學、網(wǎng)絡科學、推薦系統(tǒng)和計算機圖形學,可能不得不處理非歐式結構的數(shù)據(jù),比如圖和流形。
直到最近,深度學習在這些特定領域的采用一直很滯后,主要是因為數(shù)據(jù)的非歐氏結構性質使得基本操作(例如卷積)的定義相當困難。在這個意義上,幾何深度學習將深度學習技術擴展到了圖/流形結構數(shù)據(jù)。
圖神經(jīng)網(wǎng)絡(GNN)是近年發(fā)展起來的一個很有前景的深度學習方向,也是一種強大的圖、點云和流形表示學習方法。
然而,實現(xiàn)GNN具有挑戰(zhàn)性,因為需要在高度稀疏且不規(guī)則、不同大小的數(shù)據(jù)上實現(xiàn)高GPU吞吐量。
近日,德國多特蒙德工業(yè)大學的研究者兩位Matthias Fey和Jan E. Lenssen,提出了一個基于PyTorch的幾何深度學習擴展庫PyTorch Geometric (PyG),為GNN的研究和應用再添利器。
論文:
https://arxiv.org/pdf/1903.02428.pdf
Yann Lecun也熱情推薦了這個工作,稱贊它是一個快速、美觀的PyTorch庫,用于幾何深度學習(圖和其他不規(guī)則結構的神經(jīng)網(wǎng)絡)。
作者聲稱,PyG甚至比幾個月前NYU、AWS聯(lián)合開發(fā)的圖神經(jīng)網(wǎng)絡庫 DGL(Deep Graph Library)快了15倍!
作者在論文中寫道:“這是一個PyTorch的幾何深度學習擴展庫,它利用專用的CUDA 內核實現(xiàn)了高性能。它遵循一個簡單的消息傳遞API,將最近提出的大多數(shù)卷積和池化層捆綁到一個統(tǒng)一的框架中。所有實現(xiàn)的方法都支持CPU和GPU計算,并遵循一個不可變的數(shù)據(jù)流范式,該范式支持圖結構隨時間的動態(tài)變化。”
PyG已經(jīng)在MIT許可下發(fā)布,可以在GitHub上獲取。里面有完整的文檔說明,并提供了作為起點的教程和示例。
地址:
https://github.com/rusty1s/pytorch_geometric
PyTorch Geometry:基于PyTorch的幾何深度學習擴展庫
PyTorch Geometry是一個基于PyTorch的幾何深度學習擴展庫,用于不規(guī)則結構輸入數(shù)據(jù),例如圖(graphs)、點云(point clouds)和流形(manifolds)。
PyTorch Geometry包含了各種針對圖形和其他不規(guī)則結構的深度學習方法,也稱為幾何深度學習,來自于許多已發(fā)表的論文。
此外,它還包含一個易于使用的mini-batch加載器、多GPU支持、大量通用基準數(shù)據(jù)集和有用的轉換,既可以學習任意圖形,也可以學習3D網(wǎng)格或點云。
在PyG中,我們用一個節(jié)點特征矩陣和一個稀疏鄰接元組
代表一個圖
其中以坐標
格式編碼索引,
保持?D?維邊緣特征。
所有面向用戶的API,據(jù)加載例程、多GPU支持、數(shù)據(jù)增強或模型實例化都很大程度上受到PyTorch的啟發(fā),以便使它們盡可能保持熟悉。
Neighborhood Aggregation:將卷積算子推廣到不規(guī)則域通常表示為一個鄰域聚合(neighborhood aggregation),或message passing scheme (Gilmer et al., 2017)。
其中,表示一個可微分的置換不變函數(shù),例如?sum, mean or max,而
和
表示可微分函數(shù),例如?MLP。
在實踐中,這可以通過收集和散布節(jié)點特性并利用broadcasting進行
圖1
幾乎所有最近提出的鄰域聚合函數(shù)可以利用這個接口,已經(jīng)集成到PyG的方法包括(但不限于):
對于任意圖形學習,我們已經(jīng)實現(xiàn)了:
GCN(Kipf & Welling, 2017)和它的簡化版本SGC(Wu et al., 2019)
spectral chebyshev和ARMAfilter convolutionss (Defferrard et al., 2016; Bianchi et al., 2019)
GraphSAGE(Hamilton et al., 2017)
attention-based operatorsGAT(Veli?kovi? et al., 2018)及AGNN (Thekumparampil et al., 2018),
Graph Isomorphism Network (GIN) from Xu et al. (2019)
Approximate Personalized Propagation of Neural Predictions (APPNP) operator (Klicpera et al., 2019)
對于學習具有多維邊緣特征的點云,流形和圖,我們提供了:
Schlichtkrull et al. (2018)的relationalGCNoperator
PointNet++(Qi et al., 2017)
PointCNN(Li et al., 2018)
kernel-based methodsMPNN(Gilmer et al., 2017),
MoNet(Monti et al., 2017)
SplineCNN(Fey et al., 2018)
以及邊緣卷積算子EdgeCNN(Wang et al., 2018b).
實驗評估
我們通過對同類評估場景進行綜合比較研究,評估了利用PyG所實現(xiàn)方法的正確性。所有使用過的數(shù)據(jù)集的描述和統(tǒng)計可以在論文附錄中找到。
對于所有的實驗,我們都盡可能地遵循各自原始論文的超參數(shù)設置,GitHub存儲庫中提供了復制所有實驗的代碼。
表2:圖分類的結果
表3:點云分類的結果
我們對多個數(shù)據(jù)模型對進行了多次實驗,并報告了在單個NVIDIA GTX 1080 Ti上獲得的整個訓練過程的運行情況(表4)。與Deep Graph Library (DGL)(Wang et al., 2018a)相比,PyG訓練模型的速度快了15倍。
表4:訓練runtime比較
安裝、教程&示例
PyTorch Geometric使實現(xiàn)圖卷積網(wǎng)絡變得非常容易(請參閱GitHub上的教程)。
例如,這就是實現(xiàn)一個邊緣卷積層(edge convolution layer)所需的全部代碼:
import torchfrom torch.nn import Sequential as Seq, Linear as Lin, ReLUfrom torch_geometric.nn import MessagePassingclass EdgeConv(MessagePassing): def __init__(self, F_in, F_out): super(EdgeConv, self).__init__() self.mlp = Seq(Lin(2 * F_in, F_out), ReLU(), Lin(F_out, F_out)) def forward(self, x, edge_index): # x has shape [N, F_in] # edge_index has shape [2, E] return self.propagate(aggr='max', edge_index=edge_index, x=x) # shape [N, F_out] def message(self, x_i, x_j): # x_i has shape [E, F_in] # x_j has shape [E, F_in] edge_features = torch.cat([x_i, x_j - x_i], dim=1) # shape [E, 2 * F_in] return self.mlp(edge_features) # shape [E, F_out]
此外,與其他深度圖神經(jīng)網(wǎng)絡庫相比,PyTorch Geometric的速度更快:
表:在一塊NVIDIA GTX 1080Ti上的訓練runtime
安裝
確保至少安裝了PyTorch 1.0.0,并驗證cuda/bin和cuda/include分別位于$PATH和 $cpathrespecific,例如:
$ python -c "import torch; print(torch.__version__)">>> 1.0.0$ echo $PATH>>> /usr/local/cuda/bin:...$ echo $CPATH>>> /usr/local/cuda/include:...
然后運行:
$ pip install --upgrade torch-scatter$ pip install --upgrade torch-sparse$ pip install --upgrade torch-cluster$ pip install --upgrade torch-spline-conv (optional)$ pip install torch-geometric
運行示例
cd examplespython cora.py
paper:
https://arxiv.org/pdf/1903.02428.pdf
GitHub:
https://github.com/rusty1s/pytorch_geometric
-
神經(jīng)網(wǎng)絡
+關注
關注
42文章
4819瀏覽量
106022 -
深度學習
+關注
關注
73文章
5586瀏覽量
123618 -
pytorch
+關注
關注
2文章
812瀏覽量
14414 -
GNN
+關注
關注
1文章
31瀏覽量
6675
原文標題:LeCun推薦:最新PyTorch圖神經(jīng)網(wǎng)絡庫,速度快15倍(GitHub+論文)
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
機器學習實戰(zhàn):GNN加速器的FPGA解決方案
Facebook研究開放新框架,讓深度學習更加容易
基于PyTorch的深度學習入門教程之PyTorch的安裝和配置
基于PyTorch的深度學習入門教程之PyTorch簡單知識
PyTorch教程12.1之優(yōu)化和深度學習

評論