沐曦股份科學計算團隊近期取得突破性進展,成功將主流分子動力學模擬引擎GROMACS中的FEP計算全流程部署于GPU執(zhí)行,并實現(xiàn)2.5倍性能提升,相關成果獲得GROMACS官方團隊的高度認可,該GPU加速功能將在GROMACS 2026官方版本中正式發(fā)布,核心論文已發(fā)表于國際權威期刊 ACS Omega。同時,團隊自主研發(fā)的FEP工作流自動化管理工具MetaxFEP相關論文已正式發(fā)表在BIBE2025生物信息工程和生物醫(yī)學會議論文集中,并在ICBBS會議上榮獲分會最佳口頭報告獎。這些成果的取得,標志著國產(chǎn)GPU加速技術在計算機輔助藥物發(fā)現(xiàn)領域,已初步形成從算法優(yōu)化到工具開發(fā)、再到實際工作流支撐的完整技術鏈條,為行業(yè)提供了切實可行的高效計算解決方案。
計算機輔助藥物發(fā)現(xiàn)流程通常涵蓋多個關鍵環(huán)節(jié),包括分子表征、靶標蛋白結構預測、分子對接,以及基于動力學模擬的自由能預測等。其中,對配體-蛋白質結合自由能的精準預測通常采用自由能微擾(Free Energy Perturbation, FEP)方法,通過分子動力學模擬加以實現(xiàn)。FEP方法憑借其在預測結合自由能方面的高精度,被廣泛視為藥物篩選流程中最終階段精細篩選與先導化合物優(yōu)化的“金標準”工具。
然而,傳統(tǒng)FEP應用長期面臨兩大關鍵瓶頸:一是計算速度緩慢,龐大的計算需求導致模擬耗時過長,嚴重制約了藥物研發(fā)的迭代效率;二是操作流程復雜,涉及體系準備、拓撲生成、中間態(tài)窗口設置、平衡與采樣以及數(shù)據(jù)分析等多個步驟,手動操作不僅費時,且容易引入誤差。沐曦股份科學計算團隊近期開展的一系列研究工作,正是為了系統(tǒng)性地應對上述挑戰(zhàn)。
GROMACS模擬引擎中FEP
計算的GPU加速研究
GROMACS是一款由瑞典皇家理工學院(KTH)開發(fā)的開源分子動力學模擬引擎。憑借出色的性能與完善的功能,它在全球范圍內擁有大量活躍用戶,并常年位列世界各大超級計算機上使用最廣泛的前三大科學計算應用之一。在制藥領域,GROMACS常被用于FEP計算,以預測分子間相互作用的自由能變化。然而,目前其官方版本中的FEP計算僅支持在CPU上運行,這嚴重限制了整體模擬效率。
針對這一瓶頸,沐曦股份科學計算團隊實現(xiàn)了FEP算法在GPU上的完整移植與優(yōu)化。該GPU加速版本能夠將FEP模擬全流程部署于GPU執(zhí)行,使整體性能提升至原版的2.5倍。此項工作獲得了GROMACS官方團隊的高度認可,相關代碼現(xiàn)已正式合入GROMACS官方代碼倉庫,計劃納入其2026年首版發(fā)布中。相關研究成果已發(fā)表于美國化學會旗下期刊 ACS Omega,全文開放獲取,歡迎感興趣的讀者查閱下載。
核心貢獻
GPU算法設計與優(yōu)化:開發(fā)了基于GPU的自由能微擾(FEP)作用力計算算法,并針對不同GPU硬件架構進行了深度優(yōu)化,包括任務劃分邏輯、數(shù)據(jù)交換機制與內存排布策略等,充分發(fā)揮GPU并行計算效能。
全流程GPU化實現(xiàn):在完成FEP作用力計算加速的基礎上,進一步將積分與狀態(tài)更新等關鍵步驟移植至GPU,實現(xiàn)了FEP模擬全流程的GPU運行,大幅減少了CPU與GPU之間的數(shù)據(jù)傳輸開銷,使整體性能達到原版的2.5倍。
計算精度嚴格驗證:優(yōu)化后的代碼通過了多階段嚴謹驗證,在多個測試數(shù)據(jù)集上的計算結果均達到化學精度(誤差<2.0 kcal/mol),有力保障了模擬結果的可靠性與科學性。
MetaxFEP: 基于沐曦股份GPU的FEP
工作流自動化管理工具
沐曦股份科學計算團隊自研的MetaxFEP工具可以實現(xiàn)自動化高效的FEP流程構建、執(zhí)行和管理。MetaxFEP 針對性地解決了FEP研究領域存在的可復現(xiàn)性和易用性問題。用戶僅需提供目標蛋白結構和配體分子的文件,MetaxFEP 即可智能解析并自動構建完整的FEP計算工作流,涵蓋從預處理到結果分析的所有必要環(huán)節(jié)。同時,整個工作流在沐曦GPU上執(zhí)行,實現(xiàn)了從數(shù)據(jù)準備到核心計算的全流程GPU深度加速。最終,平臺會精準預測目標蛋白與配體間的結合自由能變化,并將可靠的計算結果以清晰易用的CSV格式文件輸出。
MetaxFEP的計算可靠性和卓越性能已通過嚴謹?shù)幕鶞蕼y試得到充分驗證。其預測結果與實驗測量值之間的誤差小于2.0 kcal/mol,達到化學精度;同時,測試得到的Pearson秩相關系數(shù)(R2)大于0.6,有效證明了其出色的排序能力。在性能方面,憑借著前文中介紹的FEP計算的全程GPU優(yōu)化,MetaxFEP 展現(xiàn)出顯著優(yōu)勢。在單張沐曦曦云C500 GPU上執(zhí)行FEP計算,其速度可達到128核CPU服務器的3倍以上。當擴展到配備8張曦云C500 GPU的高性能服務器時,完成一組典型的蛋白質-配體自由能計算任務所需時間大幅縮短至僅約10小時。相較于同等規(guī)模的128核CPU計算資源,整體效率提升高達17倍,從而極大加速了藥物研發(fā)周期。
MetaxFEP相關論文發(fā)表在BIBE2025生物信息工程和生物醫(yī)學會議論文集中。在BIBE2025和ICBBS2025會議上,沐曦股份科學計算團隊向行業(yè)專家和學者做了MetaxFEP的學術報告,并在ICBBS會議中獲得分會最佳口頭報告獎項。
以上工作均是沐曦股份“AI for Drug Discovery (AI4DD)”計算平臺構建中的關鍵組成部分。沐曦股份致力于打造一條完整、高效、由AI驅動并全面GPU加速的藥物研發(fā)工作流。該平臺深度整合傳統(tǒng)計算工具與前沿AI模型,為用戶提供高性能、一體化研發(fā)解決方案,實現(xiàn)從靶點發(fā)現(xiàn)到先導化合物優(yōu)化的全流程加速。
關于沐曦股份
沐曦股份致力于自主研發(fā)全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟發(fā)展。
-
gpu
+關注
關注
28文章
5196瀏覽量
135510 -
計算機
+關注
關注
19文章
7809瀏覽量
93230 -
科學計算
+關注
關注
0文章
6瀏覽量
1241 -
沐曦
+關注
關注
1文章
80瀏覽量
1828
原文標題:突破“金標準”計算瓶頸:沐曦股份GPU加速技術助力藥物研發(fā)降本增效
文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
沐曦股份正式推出曦索X系列全新GPU品牌與產(chǎn)品線
沐曦股份自研的MetaXLink高速互連技術,突破傳統(tǒng)PCIe總線限制
大曉機器人與沐曦股份簽署戰(zhàn)略合作協(xié)議
沐曦股份在上海證券交易所科創(chuàng)板掛牌上市
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
DLInfer聯(lián)手沐曦股份實現(xiàn)數(shù)據(jù)生成場景的實際落地
沐曦股份GPU加速技術助力藥物研發(fā)降本增效
評論