chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過RAPIDS加速單細胞DNA和RNA基因組分析

星星科技指導員 ? 來源:NVIDIA ? 作者:Avantika Lal ? 2022-04-27 16:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人體由近 40 萬億個細胞組成,有許多不同類型。實驗生物學的最新進展使探索單個細胞的遺傳物質(zhì)成為可能。隨著單細胞基因組學這一新領(lǐng)域的誕生,科學家們現(xiàn)在可以探測人體內(nèi)單個細胞的 DNA 和 RNA 。

單細胞基因組分析已經(jīng)確定了人體內(nèi)的新型細胞,發(fā)現(xiàn)了是什么使這些細胞彼此不同,以及不同類型的細胞如何對疾病或藥物作出反應。單細胞基因組學也被證明是當前 COVID-19 大流行的關(guān)鍵,它可以識別易受感染的細胞并揭示感染患者免疫系統(tǒng)的變化。

pYYBAGJo-1qAVx_-AAEaQhZ8kUc974.png

圖 1 。單細胞 RNA 測序?qū)嶒灥墓ぷ髁鞒獭7蛛x單個細胞并測量每個細胞的基因活性。具有相似基因活性的細胞聚集在一起以識別群體中的各種類型的細胞。

隨著最近的實驗對數(shù)百萬個細胞進行測序,單細胞數(shù)據(jù)的可用性和數(shù)據(jù)集的大小也在不斷增加。這種分析通常是探索性的,并從互動中得到進一步的好處——在更精細的尺度上識別不同類型的細胞,比較細胞類型并可視化它們之間的關(guān)系。當前的工作流仍然非常緩慢,這使得它們對于研究所需的交互分析來說是不可能的。

RAPIDS :用 GPUs 加速數(shù)據(jù)科學

RAPIDS 是一套開源庫,通過 GPU 加速的力量,可以加速端到端的數(shù)據(jù)科學工作流程。 RAPIDS 使得使用類似于 NumPy 、 pandas 和 scikit learn 的 Python api 對大型數(shù)據(jù)集執(zhí)行交互式數(shù)據(jù)分析成為可能。

考慮執(zhí)行單單元分析的典型工作流。這從一個矩陣開始,這個矩陣映射每個細胞中遇到的每個基因的數(shù)量。對數(shù)據(jù)進行預處理,濾除噪聲,然后對數(shù)據(jù)進行歸一化處理,得到每個細胞中每個人類基因的活性。在這一步中,機器學習也常用于糾正數(shù)據(jù)收集中的工件。接下來,在聚類和可視化之前執(zhí)行維數(shù)縮減,以識別具有相似遺傳活動的細胞簇。最后,你比較這些細胞群的遺傳活動,以了解為什么不同類型的細胞表現(xiàn)和反應不同。

poYBAGJo-2CAauOPAACZpci4Dm0534.png

圖 2 :顯示單細胞 RNA 測序數(shù)據(jù)分析步驟的管道。從每個細胞的基因活性矩陣開始, RAPIDS 庫可以用于進行數(shù)據(jù)處理、降維、聚類和可視化,并在不同的簇間發(fā)現(xiàn)不同活性的差異基因。

我們在 clara-parabricks/rapids-single-cell-examples GitHub repo 中發(fā)布了這個精確工作流的 GPU – 加速版本。 repo 包含一個示例 notebook ,它使用 RAPIDS 和 Scanpy 分析 70000 個人體肺細胞的數(shù)據(jù)集,以識別對 COVID-19 敏感的細胞。 Scanpy 是一個用于分析單細胞基因表達數(shù)據(jù)的工具包,提供了使用 RAPIDS 加速特定命令的選項。我們在回購中也有一個筆記本的 CPU 版本 以供比較。

例如,運行 UMAP 以使用 RAPIDS 可視化近 70000 個單元格需要以下命令:

sc.tl.umap(adata, min_dist=umap_min_dist, spread=umap_spread, method='rapids')

umap-visualization-625x298.png

圖 3 。由 RAPIDS 創(chuàng)建的人肺樣本中約 70000 個細胞的 UMAP 可視化。細胞被洛文聚類標記。

使用 RAPIDS 生成這個 UMAP 可視化需要 1 秒,而在 CPU 上則需要 80 秒。事實上, RAPIDS 可以加速整個單單元分析工作流程,甚至可以在大型數(shù)據(jù)集上進行交互式探索性數(shù)據(jù)分析。

在 11 分鐘內(nèi)分析一百萬個細胞

我們將我們的 RAPIDS 分析工作流程應用于現(xiàn)有最大的單細胞數(shù)據(jù)集之一, 100 萬個小鼠腦細胞通過 10 倍基因組學測序。有關(guān)詳細信息,請參閱 1M_brain_gpu_analysis_uvm.ipynb Jupyter 筆記本。

有了如此大的數(shù)據(jù)量,對 CPU 的分析變得不切實際地慢了下來;我們的端到端工作流在 awsm5a CPU 實例上運行了 3 個多小時。這使得交互式分析幾乎不可能。另一方面,我們在這個更大的數(shù)據(jù)集上觀察到了更高的 GPU 加速,并且能夠在一個 GPU 上分析整個數(shù)據(jù)集。在 AWS 上運行 RAPIDS 分析也比 CPU 版本便宜 3 倍!

用于交互式單細胞分析的 GPU 功能單元瀏覽器

如前所述, RAPIDS 的數(shù)據(jù)分析速度使研究人員能夠?qū)崟r交互式地分析數(shù)據(jù)。我們開發(fā)了一個在 Jupyter 筆記本 中運行的、支持 GPU 的交互式小區(qū)瀏覽器,使這一過程更加簡單。在這個單元格瀏覽器中,您可以可視化數(shù)據(jù)集中的所有單元格,并通過點擊方法對數(shù)據(jù)執(zhí)行聚類分析。使用 RAPIDS ,這些步驟可以實時運行。

在這篇文章中,我將向您展示如何輕松地選擇一組細胞,并執(zhí)行 UMAP 和 Louvain 聚類來識別這種細胞類型中的子種群。

圖 4 通過在交互式單元格瀏覽器中使用 RAPIDS 指向并單擊實時重新聚類選定的單元格組。

結(jié)論

在這篇文章中,您看到了使用 RAPIDS 加速 GPUs 上的單細胞基因組分析是多么容易。使用 RAPIDS ,可以方便地實時交互地探索數(shù)據(jù),對不同尺度的單元進行聚類,以及對具有不同參數(shù)的大型數(shù)據(jù)集進行重新分析。所有這些都有助于更快的科學發(fā)現(xiàn)。

除了涵蓋的 API 之外, RAPIDS 還有一個大型的其他算法庫,您會發(fā)現(xiàn)這些算法在您的工作中很有用。

關(guān)于作者

Avantika Lal 是 NVIDIA 基因組學團隊的資深科學家。她開發(fā)了使用 GPUs 和深入學習來加速和改進人類基因組分析的工具。在 NVIDIA 之前,她是斯坦福大學遺傳學和病理學系的博士后研究員。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11218

    瀏覽量

    222964
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1230

    瀏覽量

    26047
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    第十二屆全國功能基因組學高峰論壇在京舉辦:聚焦人工智能與多組學融合發(fā)展

    時維金秋,群賢畢至。2025年第十二屆全國功能基因組學高峰論壇(FGC-12)近日在北京圓滿落幕。本屆論壇匯聚了包括60余位國內(nèi)頂尖學者在內(nèi)的近500名科研院所、高等院校及行業(yè)代表,圍繞“融匯組學?
    的頭像 發(fā)表于 11-19 17:05 ?421次閱讀
    第十二屆全國功能<b class='flag-5'>基因組</b>學高峰論壇在京舉辦:聚焦人工智能與多組學融合發(fā)展

    一文了解Mojo編程語言

    ,利用硬件加速提升效率。 科學計算與數(shù)據(jù)處理 高效處理大規(guī)模數(shù)值分析基因組學數(shù)據(jù)等任務。 系統(tǒng)工具開發(fā) 開發(fā)操作系統(tǒng)級工具,結(jié)合 Python 的便捷性和 C 的性能優(yōu)勢。 嵌入式與實時應用 適用于
    發(fā)表于 11-07 05:59

    序禎達生物利用NVIDIA Parabricks技術(shù)加速多組學分析

    序禎達生物是中國領(lǐng)先的多組學和測序服務提供商之一,該公司利用 NVIDIA Parabricks 來加速多組學分析。借助 Parabricks,序禎達生物將全基因組測序的時間從 7 小時縮短至 31
    的頭像 發(fā)表于 09-29 16:05 ?630次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+化學或生物方法實現(xiàn)AI

    了整個小鼠海馬體,能檢測腦細胞的電活動。 2、真菌計算 只能說創(chuàng)造是無價的無線的,真是活到老學到老 3、生物計算 DNA也能被用于計算。 DNA計算還在研究階段,面臨著許多困難,如:DNA
    發(fā)表于 09-15 17:29

    NVIDIA RAPIDS 25.06版本新增多項功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?737次閱讀

    中科曙光超智融合技術(shù)重塑生物醫(yī)藥研發(fā)新范式

    當前,海量生物數(shù)據(jù)的處理與分析能力已成為制約行業(yè)發(fā)展的關(guān)鍵瓶頸。近日,依托曙光超智融合技術(shù)建設的華東某全國產(chǎn)計算中心,與單細胞測序領(lǐng)域代表性企業(yè)墨卓生物達成戰(zhàn)略合作。以強大算力為單細胞測序、蛋白質(zhì)結(jié)構(gòu)預測及海量臨床樣本
    的頭像 發(fā)表于 08-11 11:12 ?962次閱讀

    今日看點丨我國團隊研制出系列牛用基因芯片;Littelfuse推出緊湊型PTS647輕觸開關(guān)系列

    1、我國團隊研制出系列牛用基因芯片 日前,國家乳液技術(shù)創(chuàng)新中心傳來消息,該中心技術(shù)研發(fā)團隊成功研制出奶牛種用胚胎基因組遺傳評估芯片和“高產(chǎn)、抗病、長生產(chǎn)期”功能強化基因組預測芯片。該系列基因
    發(fā)表于 07-22 11:26 ?1909次閱讀
    今日看點丨我國團隊研制出系列牛用<b class='flag-5'>基因</b>芯片;Littelfuse推出緊湊型PTS647輕觸開關(guān)系列

    中科曙光構(gòu)建全國產(chǎn)化基因組學高性能計算平臺

    近日,中科曙光承建的國內(nèi)某研究所基因組學高性能計算平臺正式交付。這是國內(nèi)生物信息學領(lǐng)域首個從底層硬件到上層軟件實現(xiàn)完全自主可控,并深度融合高性能計算與人工智能算力的平臺,成功填補了該領(lǐng)域國產(chǎn)高端算力的空白。
    的頭像 發(fā)表于 06-26 17:36 ?833次閱讀

    功率放大器在液滴微流控細胞分選中的應用

    摘要:通過對微液滴的大小和形狀進行控制,可以實現(xiàn)對單個細胞的分選。本文綜述了國內(nèi)外在微液滴分選領(lǐng)域的最新研究進展,并介紹了不同類型的功率放大器及其在微流控細胞分選中的應用。基于功率放大器在微液滴分選
    的頭像 發(fā)表于 04-03 10:08 ?595次閱讀
    功率放大器在液滴微流控<b class='flag-5'>細胞</b>分選中的應用

    太赫茲細胞能量儀主控芯片方案單片機開發(fā)控制板布局規(guī)劃

    被人體吸收,產(chǎn)生熱效應,使深層部位溫度升高,并使原子團狀的水分子活化成小分子水,使其處于高能狀態(tài),加速人體需要的生物酶的合成,同時,活化蛋白質(zhì),加速供給人體所需要養(yǎng)份,從而增強機體的免疫力和生物細胞
    發(fā)表于 03-25 15:37

    Sapphire Rapids與OpenVINO?工具套件是否兼容?

    無法確定 Sapphire Rapids 與 OpenVINO? 工具套件的兼容性
    發(fā)表于 03-05 06:55

    Evo 2 AI模型可通過NVIDIA BioNeMo平臺使用

    Evo 2 是一個強大的新型 AI 模型,它基于亞馬遜云科技(AWS)上的 NVIDIA DGX Cloud 構(gòu)建而成,能夠幫助用戶深入了解不同物種的 DNA、RNA 和蛋白質(zhì)。
    的頭像 發(fā)表于 02-28 09:57 ?1246次閱讀

    NVIDIA攜手多家機構(gòu)推動醫(yī)療健康產(chǎn)業(yè)變革

    合作的目標直指規(guī)模高達10萬億美元的醫(yī)療健康與生命科學產(chǎn)業(yè)。NVIDIA將憑借其強大的AI和加速計算技術(shù),助力合作伙伴在藥物發(fā)現(xiàn)、基因組研究等領(lǐng)域?qū)崿F(xiàn)突破性進展。通過加速計算,科學家們
    的頭像 發(fā)表于 01-14 14:28 ?1538次閱讀

    NVIDIA 攜手行業(yè)領(lǐng)先機構(gòu)推動基因組學、藥物發(fā)現(xiàn)及醫(yī)療健康行業(yè)發(fā)展

    ——NVIDIA 今日宣布新的合作伙伴關(guān)系,旨在通過加速藥物發(fā)現(xiàn)、提升基因組研究,以及利用代理式和生成式 AI 開創(chuàng)先進醫(yī)療服務,推動規(guī)模達 10 萬億美元的醫(yī)療健康與生命科學產(chǎn)業(yè)的變革。 ? AI、
    發(fā)表于 01-14 13:39 ?552次閱讀
    NVIDIA 攜手行業(yè)領(lǐng)先機構(gòu)推動<b class='flag-5'>基因組</b>學、藥物發(fā)現(xiàn)及醫(yī)療健康行業(yè)發(fā)展

    NVIDIA助力FinCatch開發(fā)智能投資輔助系統(tǒng)

    本案例中通過 NVIDIA GPU 和 RAPIDS 加速平臺,F(xiàn)inCatch 實現(xiàn)了投資研究流程的全面智能化,提升數(shù)據(jù)分析速度和準確性,幫助投資者快速獲取可操作的投資洞察。
    的頭像 發(fā)表于 01-07 09:23 ?795次閱讀