為了減少由於擴增引起的誤差,人們在一些單細胞測序的步驟中增加了 UMI(unique molecular identifiers),UMIs 是由 4-10 個隨機核苷酸組成的序列,在 mRNA 反轉錄后,進入到文庫中,每一個 mRNA,隨機連上一個 UMI,因此可以計數不同的 UMI,最終計數 mRNA 的數量。
10X genomics單細胞測序通過Barcode來標記細胞,UMI 來標記轉錄本,這樣與參考基因比對后就可以定量細胞以及基因的數量。
Cell Ranger 進一步將外顯子reads與參考轉錄本比對,尋找兼容性。注釋到單個基因信息的reads認為是一個特異的轉錄本,只有注釋到轉錄本的reads才用於UMI計數。
在逆轉錄的過程中,有些方案利用獨特分子標識符(UMI)對單分子進行標記,這些是隨機的六核苷酸,可以更精確地定量單細胞中mRNA分子的初始量。之后,通過體外轉錄或PCR擴增cDNA,然后將擴增好的cDNA文庫用於文庫制備和高通量測序。
UMIs
另一種標准化方法是使用 Unique Molecular Identifiers (UMIs)(Kivioja et al. 2012). UMIs是一種隨機條形碼(barcode)序列,長度在4-20 bp之間。 在擴增步驟之前(通常在反轉錄期間),UMIs被添加在每個轉錄本cDNA的3’或5’端。之后,對轉錄本末端進行靶向測序。這些barcodes使得在擴增步驟之前,可以對轉錄本進行定量。雖然UMIs消除擴增偏好性的效果非常好,但是不合適用於研究基因異構體和allel特異表達。
barcode : 每一個單細胞的cDNA文庫,就帶上了獨一無二的barcode了,barcode是用來區分細胞的,跟umi不同。
UMI:(Unique Molecular Identifiers)是短序列,用於唯一標記樣品庫中的每個分子。UMI被廣泛用於測序應用,大多關於DNA和cDNA的PCR重復。UMI去重復還可用於RNA-seq基因表達分析和其他定量測序方法。簡而言之:UMI是唯一可識別的短序列,作為UMI是唯一的,所以我們可以知道在PCR擴增的過程中哪些是由同一條DNA擴增出來的。
基於標簽(barcode)的單細胞識別,給每個細胞加上獨一無二的DNA序列,這樣在測序的時候,就把攜帶相同barcode的序列視為來自同一個細胞了。這種策略,可以通過一次建庫,測得數百上千個單細胞的信息。
每一個油滴中會落入一個細胞以及一個凝膠微珠,那么在每一個凝膠微珠中上長滿了不同的Cell Barcode和UMI Barcode連接形成的序列,再加上一端PolyT的抓手,構成我們的捕獲凝膠微珠。而這個凝膠微珠抓手就會使用oligo dT抓住mRNA構建文庫。
10X的基本技術原理:一個油滴=一個單細胞=一個凝膠微珠=一個RNA-Seq
BD的基本技術原理:一個微孔=一個單細胞=一個磁珠=一個RNA-Seq
REF
https://blog.csdn.net/weixin_46021869/article/details/115733190
https://www.sohu.com/a/122201336_390793
https://www.jianshu.com/p/f0f6ae624c00
https://www.plob.org/article/11101.html
https://zhuanlan.zhihu.com/p/73077913?from_voters_page=true