三、單細胞測序原理
今天主要介紹單細胞測序原理。10X Genomics和BD Rhapsody是目前單細胞測序的兩大主流平台,所以今天的單細胞測序原理介紹也是基於這兩個平台的。
(1)10X Genomics單細胞測序原理
上圖是10X單細胞測序的原理圖。首先要說明的是,單細胞測序和Bulk RNA-seq測序的區別,並不是測序本身的區別,它們同樣是基於二代測序技術進行的測序,它們的區別主要是體現在前期對細胞的處理上。
我們從上圖可以看出,10X的單細胞測序需要經過一個雙十字系統,經過這個系統才能達到單細胞水平的捕獲。在圖最左邊是帶有標記的凝膠微珠,在這個系統中凝膠微珠沿着橫向通道向右流動。在第一個十字交叉的地方,放進去細胞懸液和酶,這里的細胞是提前制備的單細胞的懸液。在第一個十字位置,凝膠微珠和細胞及相關酶相遇,一起向右流動。在第二個十字位置,與油相遇,形成一個個包裹着凝膠微珠和細胞的油珠,一起到右邊的位置,被收集起來。這樣一個細胞和一個凝膠微珠在一起,並處在獨立的空間內。
當這樣包裹一個細胞和一個凝膠微珠的油珠被收集之后,細胞就會在酶的作用下破裂,釋放出細胞內的RNA,這些RNA就會連接到凝膠微珠上。那為什么釋放出來的RNA會連接到凝膠微珠上呢?我們看下邊這個圖。
原來在凝膠微珠表面覆蓋了一層短的核酸序列,這些短的核酸序列都是由4部分構成:R1、10X Barcode、UMI和Poly(dT)VN。其中Poly(dT)VN部分是富集T(胸腺嘧啶)的序列,我們知道在RNA的3'末端有一個polyA的尾巴,所以當RNA被釋放出來的時候,它的polyA尾巴剛好和凝膠微珠上的poly(dT)VN序列結合,一個RNA連接到凝膠微珠上的一個序列。
當拿到帶有RNA的凝膠微珠之后,就可以在反轉錄酶的作用下生成cDNA,然后就是cDNA的擴增,就和Bulk RNA-seq里的擴增一樣了。
剛才我們看到擴增之后大致形成了如上圖所示的序列,那這些序列都是什么呢?其中兩端藍色和黃色的P5和P7,是為了測序而加上的,它們更夠和測序芯片上的寡聚核苷酸鏈進行互補結合;黑色的部分,Read1和Read2是測序引物;中間灰色的橫線即要檢測的核酸序列;Sample Index是加進去的樣本ID,因為雖然建庫的時候是分開的,但是測序的時候是多個樣本一起的,所以加進去樣本ID以作區分;剩下的綠色部分10X Barcode和紅色部分UMI是關鍵部分。每個凝膠微珠上只攜帶一種10X Barcode序列,即一個凝膠微珠上所有序列的Barcode部分都是序列相同的,它的作用是標記細胞,即測序完成后如何區分哪些序列屬於一個細胞的呢,就是看它們的Barcode部分是不是一樣的;UMI的全稱是Unique Molecular Index,它的作用是為了對RNA的絕對表達水平進行計數。細胞破裂后一個RNA分子會和凝膠微珠上的一個短核酸序列相結合,所以當我們比對確定RNA屬於哪個基因后,只需要把來自相同基因的RNA聚到一起,統計一下UMI的種類數就行了。注意,這里是UMI的種類數,不是UMI的個數。以下圖為例:
以這個圖為例,我們把相同基因對應的序列放在一起,我們可以看到它們都帶有一樣的綠色的部分,那個部分就是10X Barcode部分,這些序列來着同一個細胞,所以它們具有相同的Barcode。挨着Barcode往右一點就是UMI部分,可以看到Gene1有兩種UMI,每種兩個;Gene2有3種UMI,第一種3個、第二種1個、第三種1個、Gene3000有1種UMI,有3個。因此我們就可以知道,Gene1表達量為2,Gene2表達量為3,Gene3表達量為1,即它們的UMI去重后的個數。也可以看出雖然它們處在相同的擴增環境下,但是它們的擴增倍數並不相同,這個就是PCR擴增的偏好性。因為單細胞測序計算的是UMI的種類數,所以它避免了擴增偏好性的問題。以上就是10X Genomics單細胞測序的原理。
BD單細胞測序的擴增和測序部分和10X是一樣的,它們的區別主要在於捕獲單細胞的部分。
如上圖所示,這是BD捕獲單細胞的方法。首先它使用的不是雙十字系統,而是蜂巢板,一個一個孔,好像蜂巢一樣。每個孔的大小比一個細胞稍微大一些,可以同時放下一個細胞和一個凝膠微珠。它的操作是首先把細胞懸液倒在蜂巢板上,靜置,使細胞在重力作用下進入蜂巢孔(所以它的單細胞捕獲要比10X的慢),然后在蜂巢板上加上凝膠微珠,等凝膠微珠也落到蜂巢孔里和細胞結合,然后洗去多余的凝膠微珠,從而達到單細胞捕獲的目的。
但是這樣的操作會不會有的蜂巢孔是空的,而有的進去兩個細胞呢?當然是會的,想要每個孔里剛好都有一個凝膠微珠和一個細胞是很難的,但是只要這部分的比例不用太大就行。所以在它的儀器上會有如下的統計展示。在這個展示里會統計單細胞捕獲的具體情況,當右側這些統計的指標都是PASS的時候,就說明此次單細胞捕獲是合格的,可以進行后續的操作了。當細胞捕獲后,它的后續部分原理和10X就一樣了。
下圖是10X和BD的一個對比。