單細胞分析實錄(1): 認識Cell Hashing


這是一個新系列

差不多是一年以前,我定導后沒多久,接手了讀研后的第一個課題。合作方是醫院,和我對接的是一名博一的醫學生,最開始兩邊的老師很排斥常規的單細胞文章思路,即各大類細胞分群、注釋、描述,所以起初的幾個月都在摸索一條主線,再后來有主線了,要加實驗驗證,周期有點長。我這邊的分析基本做完。讀研生活還在繼續,我也不能太在意這一個課題,盡管有些時候我也很着急,盡管我在這個課題上花了很多時間。整理分析流程是個好習慣,最大的受益者還是自己,所以接下來我打算把我在處理單細胞轉錄組過程中,學到的用到的所有技能以這樣的形式寫出來,估計有二三十篇吧~

我想先從Cell Hashing這樣一種改良的單細胞測序技術開始

1. CITE-seq

事實上Cell Hashing是在CITE-seq的基礎上改進的,CITE-seq全稱cellular indexing of transcriptomes and epitopes by sequencing,是一種同時對細胞內RNA和細胞表面蛋白進行測序的技術。

測序原理如上圖,將特定的抗體連上一段序列,序列上包含與抗體信息對應的antibody barcode,像右上方表格一樣,還包含一段ploy-A。該抗體復合物和細胞共培養后,細胞表面就會連上一些抗體,某種蛋白分子越多,連上的抗體就會越多。過流式之后,裂解細胞,斷開二硫鍵,此時細胞內的RNA和抗體復合物來源的序列都會連到磁珠上,像右下圖那樣,這兩種類型的序列長度不同,可以分開建庫,調整核酸濃度,以確保兩者都有合適的測序深度。

所以這樣一種技術,除了提供轉錄組的信息,還提供了部分蛋白的信息。正如作者所說,多模態數據應用得越來越多。
支持cite-seq的R包去年看的時候,我知道有Seurat和CiteFuse,CiteFuse今年發表在Bioinformatics。

2. Cell Hashing

Cell Hashing和CITE-seq的測序原理基本一樣,只是換了一個應用場景。它解決的問題是:如何將不同樣本的細胞混起來測序(便宜),測完了還能區分哪個細胞來源於哪個樣本,這樣做也減少了批次效應。

標題里面提到了doublet檢測僅針對來源於兩個樣本的doublet,不是指不同cell type的doublet

背景中提到了另一種解決這類問題的方案就是提供樣本的遺傳多態性信息(單細胞數據比對后也能得到部分信息,和已知的樣本信息比較,就能知道細胞來源於哪個樣本了),當然這個信息不那么容易獲取。

如圖,不同的樣本有不同的antibody barcode。

實驗過程如上圖,在選擇抗體時,盡量選擇普適的抗體,比如CD45,免疫細胞都表達。是用一種還是多種無所謂(原文用了4種,CD45, CD98, CD44, and CD11a),只要保證antibody barcode與樣本對應即可。

原文提供了針對cell hashing數據的拆分方法,這是對應的兩個圖。B圖中的一個點和C圖中的一列表示一個液滴(或者理解為一個cellular barcode)。正常情況下,一個液滴里面只有一個細胞,那么對應的樣本tag (HTO) 只有一個,也就是只有一個tag有UMI,其他tag的UMI應該為0,不然就是doublet或者空的液滴(negative)。

3. Cell Hashing測序的拆分原理

通常我們在完成測序數據比對后,能得到一個表達矩陣,行為gene列為細胞,而cell hashing的數據,比對后得到的是行為gene+tag,列為細胞。上圖給出的tag x cell的一個例子,我們利用的是這個矩陣來判定每個細胞屬於哪個樣本。

  • 第一步是對UMI矩陣標准化,式子里的i表示第幾行,n表示樣本(tag)的總數;
  • 第二步是粗分類,最后一類要么是8個UMI都和高,要么都很小;

  • 第三步,假設第9類細胞的tag x cell矩陣每一行都服從負二項分布,根據觀測值擬合之后,求0.99分位數,據此來判斷某一個值是positive還是negative;
  • 第四步,一列一列看,如果只有一個positive,說明是有效的CB,根據較大的HTO歸到對應的樣本里去;兩個或多個positive則是doublet;沒有positive則是空液滴。

預告

  • 下篇寫如何從測序數據得到表達矩陣,普通10X以及cell hashing數據都適用
  • 下下篇寫cell hashing數據拆分實戰,用seurat和citefuse兩種方法

因水平有限,有錯誤的地方,歡迎批評指正!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM