自單細(xì)胞測(cè)序技術(shù)橫空出世以來(lái),由于其可以將測(cè)序縮小到單個(gè)細(xì)胞的單位內(nèi)進(jìn)行,對(duì)于更加全面精確地了解生物基因表達(dá)情況具有重要意義。但是,由于單細(xì)胞測(cè)序本身的技術(shù)特點(diǎn),盡管我們可以得到單個(gè)細(xì)胞的表達(dá)信息,但是細(xì)胞在原本組織內(nèi)的空間位置信息是完全丟失的,這些信息在理解細(xì)胞微環(huán)境或細(xì)胞間互作時(shí)同樣關(guān)鍵。
為了解決這個(gè)問(wèn)題,空間轉(zhuǎn)錄組技術(shù)出現(xiàn)了,這項(xiàng)技術(shù)可以在組織原位上以接近單個(gè)細(xì)胞大小的尺度來(lái)進(jìn)行轉(zhuǎn)錄組測(cè)序,但因?yàn)榧夹g(shù)限制以及生物組織本身的復(fù)雜性,空間轉(zhuǎn)錄組還不能精確提供單個(gè)細(xì)胞尺度上的轉(zhuǎn)錄組信息。
單細(xì)胞測(cè)序技術(shù)具有單個(gè)細(xì)胞的精度,空間轉(zhuǎn)錄組提供了組織原位的信息,因此將兩者結(jié)合起來(lái)就能近似得到完整的信息。目前已經(jīng)有許多分析工具試圖將空間信息與單細(xì)胞信息整合起來(lái),并且取得了一定的進(jìn)展。本文將介紹的CellTrek就是其中之一。
目前常用的整合算法有許多,例如去卷積,通過(guò)推斷spot內(nèi)的細(xì)胞組成來(lái)將兩者整合在一起。而CellTrek則另辟蹊徑,通過(guò)直接推斷單細(xì)胞的空間坐標(biāo)來(lái)實(shí)現(xiàn)信息的補(bǔ)全。Cell Trek的計(jì)算原理可見(jiàn)下圖。簡(jiǎn)單來(lái)說(shuō),該方法首先將單細(xì)胞數(shù)據(jù)與空間轉(zhuǎn)錄組數(shù)據(jù)整合,共嵌入到(coembed)共同的隱空間內(nèi),然后從中抽出空間轉(zhuǎn)錄組的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,使用隨機(jī)森林模型(Random Forests,RF)從spot的基因表達(dá)情況預(yù)測(cè)其空間坐標(biāo)。這里所依據(jù)的基本思路就是,細(xì)胞在組織中的分布并不是隨機(jī)混亂的,同一類細(xì)胞大多都是集中于同一片區(qū)域。
空間轉(zhuǎn)錄組的數(shù)據(jù)還會(huì)同時(shí)進(jìn)行非線性插值增強(qiáng)其空間分辨率。然后,將整個(gè)共嵌入矩陣輸入訓(xùn)練好的模型,生成一個(gè)衡量單細(xì)胞與空間spot之間表達(dá)相似性的RF距離矩陣,基于這個(gè)矩陣使用相互最近鄰域算法(mutual nearest neighbors,MNN)生成一個(gè)spot-細(xì)胞稀疏圖,最后根據(jù)細(xì)胞在稀疏圖上的相鄰spot推斷出細(xì)胞的空間坐標(biāo)。因?yàn)橄嗤愋偷募?xì)胞擁有較為相似的基因表達(dá),所以基于空間轉(zhuǎn)錄組數(shù)據(jù)訓(xùn)練的模型可以用來(lái)預(yù)測(cè)細(xì)胞的位置坐標(biāo)。
01
這一算法的優(yōu)勢(shì)在于將細(xì)胞直接定位到組織切片照片上,而不是像去卷積類方法那樣計(jì)算每個(gè)spot內(nèi)的細(xì)胞類型比例。直接定位帶來(lái)的另一個(gè)好處就是在接下來(lái)的數(shù)據(jù)分析中可操作性大大提高了,像去卷積類方法得到的細(xì)胞比例矩陣我們很難再對(duì)其進(jìn)行什么操作,但是我們可以對(duì)CellTrek 整合后的結(jié)果進(jìn)行細(xì)胞共定位分析、基因空間權(quán)重共表達(dá)分析等等,因?yàn)樗举|(zhì)仍然是單細(xì)胞數(shù)據(jù),只是附帶上了空間坐標(biāo)。
以小鼠大腦皮層的空轉(zhuǎn)數(shù)據(jù)與單細(xì)胞數(shù)據(jù)為例,我們最后得到的結(jié)果會(huì)是這樣的。可以看到不同類型的細(xì)胞在空間上呈現(xiàn)出明顯的層狀分布,這符合大腦皮層的結(jié)構(gòu)特征,并且不同的細(xì)胞類型出現(xiàn)在了它們應(yīng)該出現(xiàn)的皮層位置。 02
內(nèi)測(cè)數(shù)據(jù)結(jié)果
CellTrek的缺點(diǎn)在于,第一,對(duì)計(jì)算資源的需求比較大,當(dāng)單細(xì)胞數(shù)據(jù)量較大時(shí)會(huì)花費(fèi)比較長(zhǎng)的時(shí)間;第二,對(duì)于空轉(zhuǎn)數(shù)據(jù)與單細(xì)胞數(shù)據(jù)的匹配度要求比較高,也就是說(shuō)空轉(zhuǎn)數(shù)據(jù)與單細(xì)胞數(shù)據(jù)最好取自同一塊組織區(qū)域,不要出現(xiàn)無(wú)法匹配的空間區(qū)域或細(xì)胞類型,否則最終結(jié)果會(huì)非常混亂,如下圖。
03
內(nèi)測(cè)數(shù)據(jù)結(jié)果
總而言之,CellTrek提供了一條不同于當(dāng)下其他單細(xì)胞-空轉(zhuǎn)整合分析方法的道路,結(jié)果更加接近生物組織中的實(shí)際情況,并為整合后的下游分析提供了便利。
審核編輯:劉清
-
RF信號(hào)
+關(guān)注
關(guān)注
1文章
41瀏覽量
14970 -
卷積網(wǎng)絡(luò)
+關(guān)注
關(guān)注
0文章
43瀏覽量
3159
原文標(biāo)題:?jiǎn)渭?xì)胞空間轉(zhuǎn)錄組聯(lián)合分析硬核出擊--CellTrek
文章出處:【微信號(hào):SBCNECB,微信公眾號(hào):上海生物芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
谷歌與耶魯大學(xué)合作發(fā)布最新C2S-Scale 27B模型
基于寬帶功率放大器的聲流控細(xì)胞高效分選創(chuàng)新方案
中科曙光超智融合技術(shù)重塑生物醫(yī)藥研發(fā)新范式
軟通動(dòng)力加入openEuler社區(qū)AI聯(lián)合工作組
尋開(kāi)發(fā)伙伴 一起搞細(xì)胞電阻儀,有興趣的朋友來(lái)聊聊!
電壓放大器在介電電泳細(xì)胞分選中的應(yīng)用研究
基于細(xì)胞微流控的阻抗測(cè)試解決方案
電壓放大器在細(xì)胞分選中的作用是什么
功率放大器在液滴微流控細(xì)胞分選中的應(yīng)用
太赫茲細(xì)胞能量?jī)x主控芯片方案單片機(jī)開(kāi)發(fā)控制板布局規(guī)劃
空間光調(diào)制抗衍射光片流式細(xì)胞術(shù)中的微流控芯片
數(shù)據(jù)降維聚類工具介紹——SpatialPCA

CellTrek單細(xì)胞空間轉(zhuǎn)錄組聯(lián)合分析
評(píng)論