單細胞 RNA-seq 10X Genomics


單細胞流程跑了不少,但依舊看不懂結果,是該好好補補了。

 

有些人可能會誤會,覺得單細胞的RNA-seq數據很好分析,跟分析常規的RNA-seq應該沒什么區別。今天的這篇文章2015年3月發表在Nature Genetics Review上,專門說明了一下單細胞RNA測序數據在數據分析和計算上的挑戰(雖然已經過去1年多了,這里指出的問題和挑戰仍然是不過時的,至於這些問題和挑戰現在是不是完美解決了,這里就暫且先不討論了。)。

主要說了以下問題:

1. 單細胞RNA測序 (single cell RNA sequencing,以下簡稱scRNA-seq)數據質控和歸一化(Normalization),其實主要是歸一化。

次要還涉及了以下問題:

2. 單細胞測序應該測多少深度合適,即測幾個G的數據量。

3. 批次效應(batch effect)的問題。

另外,我在另一篇文章中看到的,也很有意思:

很多基因表達值為0的問題,當然這個也可以歸類到歸一化的問題中去。

1. spike-in. 在說明問題之前,首先要明確一下實驗設計。有一個方法,which is strongly recommended for all scRNA-seq實驗,那就是使用spike-in,而spike-in最廣泛的就是ERCC。有些實驗的protocol,使用3‘或5’端的特征序列(unique melocular identifier, UMI)來當barcode,但還是同時加上spike-in的好,加上spike-in之后,這種實驗方法可以幫助后期分析繞開擴增中產生的biases這一問題,而擴增biases是技術不穩定的最主要的一個來源。所以,強調一點,單細胞RNA-seq要做spike-in.

2. 分析pipeline. 之前針對常規RNA-seq的分析pipeline大部分還是可以公用的,比如:原始數據的回貼就可以沿用TopHat或者GSNAP等,數read counts還是可以用HTseq,樣本的聚類,差異表達分析等都可以沿用常規RNA-seq的pipeline。

image

3. 但是QC和Normalization這兩步,單細胞測序要格外小心。QC的時候,除了要注意常規的RNA-seq的QC條目,單細胞中非常重要的一點是還要確認RNA是否有降解。這點可以通過看總的回貼片段及回貼到spike-in上的片段的比例。(這里其實有個問題:如果RNA降解很嚴重,還能夠反轉擴增成功嗎?我個人猜測可能會比較難。)

總結下,單細胞的QC可以分成以下三步:Fastqc,HTseq(數reads后,看reads回貼在哪里,下圖展示的是統計整理之后的樣子)及PCA。

image
以下插播一段題外話:PCA的圖可以長成下面這樣。PCA挺有用的,不管是單細胞測序還是常規測序,特別是樣本量多的時候。

image
(圖片來源:Petropoulos et al., 2016, Cell 165, 1012–1026)

4. Normalization. 我們對常規的RNA-seq做歸一化有RPKM,FPKM或者read counts,且這種歸一化基於一個假設,即這些細胞中的RNA的量是一樣多的。但是,如果沒有spike-in的話,我們沒有辦法知道一個細胞里面到底有多少RNA,也就沒有辦法做歸一化。然而加入spike-in之后,細胞大小測序深度的不一致也會使得常用的歸一化方法不適用。這篇綜述提到的方法是Philip Brennecke 2013年發表在nature method上的,首先根據測序深度和細胞中的RNA的量對read counts進行歸一化,然后再針對spike-in和自己本身的RNA計算樣本間的變異系數。不過這個方法,后來又被另外一個方法(也是發表在nature method上的

,Dominic Grün,2014年)嫌棄了。尚無定論。

5. 測序深度。這個每個人也有每個人的做法。基本原則是:

sequenced the library to a sufficient depth to ensure that each cDNA molecule is observed at least once. 看上去有點玄乎(個人感覺:一般6-8G),細胞量越少,測序深一點,這兩者有個balance。 

6. batch effect. Batch effect的問題在scRNA-seq中更為顯著、嚴重。

One way to overcome this problem is to increase the number of biological replicates. 一種辦法是增加重復樣。有沒有別的辦法,文章沒有提。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM