近年來機(jī)器學(xué)習(xí)算法在包括自然語言處理,圖像識別等諸多領(lǐng)域大放異彩。得益于如Materials Project1, QM92,3等材料數(shù)據(jù)庫的不斷完善和發(fā)展,機(jī)器學(xué)習(xí)正在被越來越多的應(yīng)用在材料學(xué)領(lǐng)域的研究中。然而,由于研究目標(biāo)的單一性,多數(shù)工作仍然局限于解決特定的晶體結(jié)構(gòu)以及特定的材料性質(zhì)預(yù)測問題。一種泛化的,普適性的機(jī)器學(xué)習(xí)模型仍然是材料學(xué)領(lǐng)域研究的重點(diǎn)目標(biāo)。此研究是基于
基于DeepMind建立的圖神經(jīng)網(wǎng)絡(luò)框架。
在材料學(xué)領(lǐng)域,對分子或晶體結(jié)構(gòu)的特征描述需要滿足平移,轉(zhuǎn)動,鏡面不變性,以及對整體結(jié)構(gòu)特異信息的表征。常見的結(jié)構(gòu)特征描述由于其局域性,缺乏對整體結(jié)構(gòu)信息的表達(dá),因而不具有普適性。圖網(wǎng)絡(luò)模型(graph-network)是一種基于圖論的結(jié)構(gòu)化模型,從理論上完美解決了這一問題。在圖論中,圖(graph)由若干給定的頂點(diǎn)(node)及連接頂點(diǎn)的邊(edge)構(gòu)成。運(yùn)用到分子(或晶體)結(jié)構(gòu)中,原子(atom)可以由頂點(diǎn)(node)描述,連接原子之間的化學(xué)鍵(bond)可以由邊(edge)描述,從而可以把一個個分子或晶體結(jié)構(gòu)看作一個個獨(dú)立的“圖”。基于此類模型的結(jié)構(gòu)描述方法,科研工作者可以開發(fā)出針對任何材料結(jié)構(gòu)或任何物理化學(xué)性質(zhì)的普適性模型。盡管具有理論可行性,此類模型由于模型復(fù)雜度,材料數(shù)據(jù)量的限制,仍很少被應(yīng)用在材料學(xué)領(lǐng)域中4,5。近日,UC San Diego 的 Shyue Ping Ong 課題組基于DeepMind建立的圖神經(jīng)網(wǎng)絡(luò)框架6,開發(fā)了一套分子和晶體通用性質(zhì)預(yù)測模型(MEGNet),在各項(xiàng)性質(zhì)預(yù)測測試中達(dá)到了領(lǐng)先水平7。
圖 1. MEGNet 概述。每個分子/晶體結(jié)構(gòu)由化學(xué)鍵信息,原子信息,和狀態(tài)信息描述。每個結(jié)構(gòu)描述輸入模型后,依次更新,直到總的結(jié)構(gòu)輸出性質(zhì)與DFT計算值接近。
圖1中描述了該模型的工作模式: 每個結(jié)構(gòu)可用三個向量表征,分別包含原子信息,化學(xué)鍵信息,和狀態(tài)函數(shù)信息。在每一次模型訓(xùn)練迭代中,依次更新化學(xué)鍵向量,原子向量,和狀態(tài)函數(shù)向量,得到新的結(jié)構(gòu)表征向量,直到通過該表征輸出的性質(zhì)與DFT計算結(jié)果趨于一致。作者首先用QM9 分子數(shù)據(jù)集中超過130k數(shù)據(jù)作為訓(xùn)練集訓(xùn)練模型,并用得到的模型預(yù)測分子中的13項(xiàng)物理化學(xué)性質(zhì),在其中的11項(xiàng)中達(dá)到同類模型中的最優(yōu)結(jié)果(表1)。更為先進(jìn)的是,之前的工作對由狀態(tài)參數(shù)關(guān)聯(lián)的狀態(tài)函數(shù),如內(nèi)能(U0, U),焓(H),和吉布斯自由能(G),采用的是分別訓(xùn)練模型進(jìn)行預(yù)測的方法。
然而本工作中,作者采用加入狀態(tài)參數(shù)作為輸入的方法,可由單一模型同時預(yù)測U0, U, H和G,并保持與分別模型訓(xùn)練類似的準(zhǔn)確度,大大提高了訓(xùn)練效率[YZ1]。在針對晶體結(jié)構(gòu)的應(yīng)用中,作者用Materials Project數(shù)據(jù)庫中超過69k數(shù)據(jù)作為訓(xùn)練集,針對生成能,能帶帶隙,體積模量和剪切模量進(jìn)行了回歸(Regression)分析,并用帶隙值作為金屬和非金屬的判據(jù)進(jìn)行分類(classification)分析?;貧w分析中的平均絕對誤差(MAE)低于同類型模型SchNet4和CGCNN5(表2),金屬和非金屬分類分析中綜合準(zhǔn)確率達(dá)86.9%,ROC中AUC達(dá)到0.926,與此前最優(yōu)模型CGCNN類似。
表1. 不同模型在QM9上預(yù)測13項(xiàng)性質(zhì)的平均絕對誤差(MAE)對比
表2. MEGNet和其他基于圖像模型
在Materials Project數(shù)據(jù)集的預(yù)測準(zhǔn)確度對比
在對模型的深入分析中,作者發(fā)現(xiàn),從最優(yōu)模型中提取出的元素映射(embedding)與化學(xué)常識吻合。例如,將元素映射投影二維空間可發(fā)現(xiàn),Eu和Yb與其他鑭系元素距離較遠(yuǎn),而與堿土金屬更接近,這與化學(xué)經(jīng)驗(yàn)相符。這樣的分析一方面佐證了模型可以學(xué)習(xí)到可靠的化學(xué)信息,另一方面可將學(xué)習(xí)到的化學(xué)信息用于遷移學(xué)習(xí),以大大降低訓(xùn)練新模型訓(xùn)練所需數(shù)據(jù)量。例如,在此例中,作者通過用~69k生成熱的數(shù)據(jù)訓(xùn)練的模型提取的元素映射,用于預(yù)測帶隙和彈性性質(zhì)的模型訓(xùn)練,后者的數(shù)據(jù)量只有生成熱的一半甚至十分之一。通過遷移學(xué)習(xí)的方法作者得到比直接訓(xùn)練更低的MAE和提高兩倍的收斂速度。這為小數(shù)據(jù)量的性質(zhì)的高效準(zhǔn)確模型訓(xùn)練提供了可行的方案。
在模型的使用方面,用戶可登陸http://megnet.crystals.ai,根據(jù)提示輸入晶體結(jié)構(gòu)編碼或cif文件即可得到模型預(yù)測的性質(zhì)。另外,文章所涉及的Python代碼均已開源(https://github.com/materialsvirtuallab/megnet.git)。下面示例如何使用已有模型和訓(xùn)練新的模型。
1示例一: 使用分子模型
2示例二:使用晶體模型預(yù)測剪切模量
3示例三:訓(xùn)練新模型
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4819瀏覽量
106042 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8528瀏覽量
135858
原文標(biāo)題:MEGNet普適性圖神經(jīng)網(wǎng)絡(luò),精確預(yù)測分子和晶體性質(zhì)
文章出處:【微信號:zhishexueshuquan,微信公眾號:知社學(xué)術(shù)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN):時間連續(xù)性與動態(tài)適應(yīng)性的神經(jīng)網(wǎng)絡(luò)

無刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測方法的研究
NVIDIA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能
使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行時間序列預(yù)測
BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較
BP神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn)分析
什么是BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法
BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系
人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

基于光學(xué)衍射神經(jīng)網(wǎng)絡(luò)的軌道角動量復(fù)用全息技術(shù)的設(shè)計與實(shí)驗(yàn)研究

評論