序禎達生物是中國領(lǐng)先的多組學和測序服務提供商之一,該公司利用 NVIDIA Parabricks 來加速多組學分析。借助 Parabricks,序禎達生物將全基因組測序的時間從 7 小時縮短至 31 分 05 秒,幾乎是使用 CPU 加速的 14 倍。序禎達生物還通過 Parabricks BWA-Meth 實現(xiàn)了比對的顯著提速,與傳統(tǒng)比對方法相比,將甲基化比對的速度提升了 21 倍。
序禎達生物將前沿的多組學技術(shù)引入中國市場,為廣泛的商業(yè)用戶群體提供服務,是中國領(lǐng)先的多組學服務提供商之一。公司提供下一代測序(NGS)和多組學服務,其分布式測序?qū)嶒炇颐吭庐a(chǎn)生超過 1.5 PB 的數(shù)據(jù),為下游分析提供了大量有價值的數(shù)據(jù)。
序禎達生物處于測序技術(shù)的前沿,支持基因組學、轉(zhuǎn)錄組學、蛋白質(zhì)組學、微生物組學和多組學研究,通過精準測序和多組學解決方案為生命科學領(lǐng)域帶來革新。
作為中國首家使用 NVIDIA GPU 加速片段分析的 NGS 公司,序禎達生物是該領(lǐng)域公認的領(lǐng)導者和創(chuàng)新者,其旗下設有兩大主要業(yè)務部門:
FLASH-SEQ:一個覆蓋中國多個城市的 NGS 測序平臺。序禎達生物擁有 10 個實驗室,是中國最大的 NGS 測序服務供應商之一。
序禎達多組學:中國最大的多組學供應商之一,專注為制藥公司的臨床和研究階段提供服務。自 2021 年以來,序禎達生物已在中國開展了 300 多個隊列研究。
序禎達生物聯(lián)合創(chuàng)始人兼首席信息官費家俊表示:“我們?yōu)榭蛻籼峁臐駥嶒炇业礁蓪嶒炇业恼w解決方案。我們看到了 GPU 在加速生命科學發(fā)現(xiàn)方面的巨大潛力,正在開展多項業(yè)內(nèi)革命性工作,以實現(xiàn)我們下一代基因測序生產(chǎn)力的數(shù)字化?!?/p>
借助 NVIDIA 的技術(shù)加速分析
作為中國最大的測序中心之一,序禎達生物的測序儀會產(chǎn)生海量數(shù)據(jù)。因此,序禎達生物需要一個能夠處理大規(guī)模數(shù)據(jù)集并簡化分析的解決方案。該團隊采用了 NVIDIA Parabricks,這是一個用于二級分析的可擴展基因組學軟件套件,提供經(jīng) GPU 加速的可信開源工具版本。
費家俊回憶道:“2021 年,我們引入了 NVIDIA Parabricks 和 GPU,利用這些技術(shù)加速多組學分析工作負載。此次合作旨在借助 Parabricks 平臺來加速多組學分析。我們看到了 AI 在助力科學研究以及加快研究進程、為客戶提供更多支持方面的巨大潛力?!?/p>
Parabricks 將基因組處理速度提升“百倍”
序禎達生物使用 Parabricks 來加速WES(外顯子組測序)和WGS(全基因組測序)。此前,該公司在使用基因組分析工具包(GATK)和 CPU 時遭遇了顯著的延遲問題。使用 GATK 時,WES需要 15 個小時完成,WGS則需要 50 個小時。使用 CPU 加速后,WES時間降至 2 個小時,WGS時間降至 7 個小時。
但將 Parabricks 應用于這兩種類型的檢測后,速度得到了顯著提升。借助 Parabricks,WES僅需 2 分 37 秒,速度幾乎是 CPU 加速方法的 46 倍,是 GATK 的近 344 倍。WGS僅需 31 分 05 秒,速度幾乎是 CPU 加速的 14 倍,是 GATK 的近 97 倍。
這種加速直接影響患者治療效果,因為數(shù)據(jù)分析以往通常是瓶頸所在。序禎達生物信息技術(shù)總監(jiān)王佳偉解釋說:“使用 GATK 工作負載時,從WGS數(shù)據(jù)中獲取單個樣本結(jié)果需要花費 30-50 個小時。而使用 Parabricks 之后,我們可以將時間縮短至不到 1 小時?!?/p>
數(shù)據(jù)和基準測試由序禎達生物提供Parabricks 將甲基化比對加速 21 倍
Parabricks 的結(jié)果不僅與開源工具一致(這保障了研究的可重復性和透明度),還能顯著加速一直以來耗時的分析步驟。除了加速全外顯子組測序和全基因組測序之外,序禎達生物還希望改進甲基化比對。
對于經(jīng)亞硫酸氫鹽處理的 DNA 測序讀數(shù)(BS-Seq)的比對,則使用了 BWA-Meth 來檢測 DNA 甲基化。在一個 110GB 的數(shù)據(jù)集上,使用傳統(tǒng)方法完成比對需要 21 個小時。而使用 8 塊 NVIDIA T4 GPU 以及 Parabricks 中經(jīng) GPU 加速的 BWA-Meth 版本,比對時間縮短至僅 1 個小時。與傳統(tǒng)方法相比,使用 Parabricks 進行甲基化比對的速度提升了 21 倍。
數(shù)據(jù)和基準測試由序禎達生物提供NVIDIA CUDA-X 數(shù)據(jù)科學庫將單細胞分析提升至 “秒級”
序禎達生物支持多種應用場景的工作負載,包括單細胞分析。然而,單細胞數(shù)據(jù)處理可能極其耗時,尤其是在數(shù)據(jù)集規(guī)模不斷擴大的情況下。
NVIDIA CUDA-X Data Science(RAPIDS)是一套開源的 GPU 加速的數(shù)據(jù)科學和 AI 庫,可提升整個數(shù)據(jù)工作流的性能。CUDA-X DS 常用于基因組學應用中的單細胞分析和三級分析。序禎達生物發(fā)現(xiàn),在一個包含 70,000 個人類肺細胞的數(shù)據(jù)集上,與 Scanpy 相比,使用 CUDA-X DS 可以顯著加速預處理步驟。使用 Scanpy 時,預處理需要 37 分鐘完成,而使用 CUDA-X DS 時,該步驟僅需約 22 秒,速度提升了近 101 倍。
數(shù)據(jù)和基準測試由序禎達生物提供賦能一整套解決方案
從加速甲基化比對到縮短單細胞分析的預處理時間,序禎達生物借助了多種 NVIDIA 技術(shù)來減少運行時間。通過利用 NVIDIA 的硬件和軟件(包括 T4 GPU、Parabricks 和 CUDA-X DS),序禎達生物加速了一直以來耗時的流程。因此,NVIDIA 提供的完整解決方案使序禎達生物能夠應對各種不同的應用場景,并為客戶帶來即時價值。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5430瀏覽量
108206 -
gpu
+關(guān)注
關(guān)注
28文章
5035瀏覽量
133682
原文標題:序禎達生物借助 NVIDIA Parabricks 將甲基化比對速度提升 21 倍
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
燧弘華創(chuàng)與泰達生物簽署AI醫(yī)療健康領(lǐng)域戰(zhàn)略合作協(xié)議
NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載
達實智能攜手信達生物打造智慧園區(qū)新標桿
NVIDIA全棧加速代理式AI應用落地
全球各大品牌利用NVIDIA AI技術(shù)提升運營效率
NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本

默達生物完成數(shù)千萬元A1輪融資
利用NVIDIA DPF引領(lǐng)DPU加速云計算的未來

NVIDIA加速全球大多數(shù)超級計算機推動科技進步

評論