序禎達生物是中國領(lǐng)先的多組學(xué)和測序服務(wù)提供商之一,該公司利用 NVIDIA Parabricks 來加速多組學(xué)分析。借助 Parabricks,序禎達生物將全基因組測序的時間從 7 小時縮短至 31 分 05 秒,幾乎是使用 CPU 加速的 14 倍。序禎達生物還通過 Parabricks BWA-Meth 實現(xiàn)了比對的顯著提速,與傳統(tǒng)比對方法相比,將甲基化比對的速度提升了 21 倍。
序禎達生物將前沿的多組學(xué)技術(shù)引入中國市場,為廣泛的商業(yè)用戶群體提供服務(wù),是中國領(lǐng)先的多組學(xué)服務(wù)提供商之一。公司提供下一代測序(NGS)和多組學(xué)服務(wù),其分布式測序?qū)嶒炇颐吭庐a(chǎn)生超過 1.5 PB 的數(shù)據(jù),為下游分析提供了大量有價值的數(shù)據(jù)。
序禎達生物處于測序技術(shù)的前沿,支持基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、微生物組學(xué)和多組學(xué)研究,通過精準測序和多組學(xué)解決方案為生命科學(xué)領(lǐng)域帶來革新。
作為中國首家使用 NVIDIA GPU 加速片段分析的 NGS 公司,序禎達生物是該領(lǐng)域公認的領(lǐng)導(dǎo)者和創(chuàng)新者,其旗下設(shè)有兩大主要業(yè)務(wù)部門:
FLASH-SEQ:一個覆蓋中國多個城市的 NGS 測序平臺。序禎達生物擁有 10 個實驗室,是中國最大的 NGS 測序服務(wù)供應(yīng)商之一。
序禎達多組學(xué):中國最大的多組學(xué)供應(yīng)商之一,專注為制藥公司的臨床和研究階段提供服務(wù)。自 2021 年以來,序禎達生物已在中國開展了 300 多個隊列研究。
序禎達生物聯(lián)合創(chuàng)始人兼首席信息官費家俊表示:“我們?yōu)榭蛻籼峁臐駥嶒炇业礁蓪嶒炇业恼w解決方案。我們看到了 GPU 在加速生命科學(xué)發(fā)現(xiàn)方面的巨大潛力,正在開展多項業(yè)內(nèi)革命性工作,以實現(xiàn)我們下一代基因測序生產(chǎn)力的數(shù)字化。”
借助 NVIDIA 的技術(shù)加速分析
作為中國最大的測序中心之一,序禎達生物的測序儀會產(chǎn)生海量數(shù)據(jù)。因此,序禎達生物需要一個能夠處理大規(guī)模數(shù)據(jù)集并簡化分析的解決方案。該團隊采用了 NVIDIA Parabricks,這是一個用于二級分析的可擴展基因組學(xué)軟件套件,提供經(jīng) GPU 加速的可信開源工具版本。
費家俊回憶道:“2021 年,我們引入了 NVIDIA Parabricks 和 GPU,利用這些技術(shù)加速多組學(xué)分析工作負載。此次合作旨在借助 Parabricks 平臺來加速多組學(xué)分析。我們看到了 AI 在助力科學(xué)研究以及加快研究進程、為客戶提供更多支持方面的巨大潛力?!?/p>
Parabricks 將基因組處理速度提升“百倍”
序禎達生物使用 Parabricks 來加速WES(外顯子組測序)和WGS(全基因組測序)。此前,該公司在使用基因組分析工具包(GATK)和 CPU 時遭遇了顯著的延遲問題。使用 GATK 時,WES需要 15 個小時完成,WGS則需要 50 個小時。使用 CPU 加速后,WES時間降至 2 個小時,WGS時間降至 7 個小時。
但將 Parabricks 應(yīng)用于這兩種類型的檢測后,速度得到了顯著提升。借助 Parabricks,WES僅需 2 分 37 秒,速度幾乎是 CPU 加速方法的 46 倍,是 GATK 的近 344 倍。WGS僅需 31 分 05 秒,速度幾乎是 CPU 加速的 14 倍,是 GATK 的近 97 倍。
這種加速直接影響患者治療效果,因為數(shù)據(jù)分析以往通常是瓶頸所在。序禎達生物信息技術(shù)總監(jiān)王佳偉解釋說:“使用 GATK 工作負載時,從WGS數(shù)據(jù)中獲取單個樣本結(jié)果需要花費 30-50 個小時。而使用 Parabricks 之后,我們可以將時間縮短至不到 1 小時?!?/p>
數(shù)據(jù)和基準測試由序禎達生物提供Parabricks 將甲基化比對加速 21 倍
Parabricks 的結(jié)果不僅與開源工具一致(這保障了研究的可重復(fù)性和透明度),還能顯著加速一直以來耗時的分析步驟。除了加速全外顯子組測序和全基因組測序之外,序禎達生物還希望改進甲基化比對。
對于經(jīng)亞硫酸氫鹽處理的 DNA 測序讀數(shù)(BS-Seq)的比對,則使用了 BWA-Meth 來檢測 DNA 甲基化。在一個 110GB 的數(shù)據(jù)集上,使用傳統(tǒng)方法完成比對需要 21 個小時。而使用 8 塊 NVIDIA T4 GPU 以及 Parabricks 中經(jīng) GPU 加速的 BWA-Meth 版本,比對時間縮短至僅 1 個小時。與傳統(tǒng)方法相比,使用 Parabricks 進行甲基化比對的速度提升了 21 倍。
數(shù)據(jù)和基準測試由序禎達生物提供NVIDIA CUDA-X 數(shù)據(jù)科學(xué)庫將單細胞分析提升至 “秒級”
序禎達生物支持多種應(yīng)用場景的工作負載,包括單細胞分析。然而,單細胞數(shù)據(jù)處理可能極其耗時,尤其是在數(shù)據(jù)集規(guī)模不斷擴大的情況下。
NVIDIA CUDA-X Data Science(RAPIDS)是一套開源的 GPU 加速的數(shù)據(jù)科學(xué)和 AI 庫,可提升整個數(shù)據(jù)工作流的性能。CUDA-X DS 常用于基因組學(xué)應(yīng)用中的單細胞分析和三級分析。序禎達生物發(fā)現(xiàn),在一個包含 70,000 個人類肺細胞的數(shù)據(jù)集上,與 Scanpy 相比,使用 CUDA-X DS 可以顯著加速預(yù)處理步驟。使用 Scanpy 時,預(yù)處理需要 37 分鐘完成,而使用 CUDA-X DS 時,該步驟僅需約 22 秒,速度提升了近 101 倍。
數(shù)據(jù)和基準測試由序禎達生物提供賦能一整套解決方案
從加速甲基化比對到縮短單細胞分析的預(yù)處理時間,序禎達生物借助了多種 NVIDIA 技術(shù)來減少運行時間。通過利用 NVIDIA 的硬件和軟件(包括 T4 GPU、Parabricks 和 CUDA-X DS),序禎達生物加速了一直以來耗時的流程。因此,NVIDIA 提供的完整解決方案使序禎達生物能夠應(yīng)對各種不同的應(yīng)用場景,并為客戶帶來即時價值。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5594瀏覽量
109738 -
gpu
+關(guān)注
關(guān)注
28文章
5194瀏覽量
135455
原文標題:序禎達生物借助 NVIDIA Parabricks 將甲基化比對速度提升 21 倍
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)
NVIDIA推出面向語言、機器人和生物學(xué)的全新開源AI技術(shù)
利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護科學(xué)
NVIDIA 利用全新開源模型與仿真庫加速機器人研發(fā)進程
燧弘華創(chuàng)與泰達生物簽署AI醫(yī)療健康領(lǐng)域戰(zhàn)略合作協(xié)議
電焊機EMC測試整改:基于200+案例的統(tǒng)計學(xué)分析
NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載
達實智能攜手信達生物打造智慧園區(qū)新標桿
NVIDIA全棧加速代理式AI應(yīng)用落地
全球各大品牌利用NVIDIA AI技術(shù)提升運營效率
NVIDIA攜手微軟加速代理式AI發(fā)展
借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造
利用NVIDIA技術(shù)構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案
NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理
序禎達生物利用NVIDIA Parabricks技術(shù)加速多組學(xué)分析
評論