第三代測序技術是指單分子測序技術,在測序過程中不需要涉及PCR擴增,實現了對每一條DNA分子的單獨測序。三代測序技術具有超長讀長,還擁有不需要模板擴增、運行時間較短、直接檢測表觀修飾位點、較高的隨機測序錯誤等特點。它彌補了第二代測序讀長短、受GC含量影響大等局限性,已在小型基因組從頭測序和組裝中有較多應用。
目前比較有代表性的三代測序平台公司有三家,分別是Pacific Biosciences(PacBio)公司的單分子實時測序技術、Oxford Nanopore公司的單分子納米孔測序技術、和Helicos公司的真正單分子測序技術tSMSTM。
Helicos,Oxford Nanopore,Pacific Biosciences
Helicos,是第三代測序儀的先驅,它生產了第一台單分子測序儀HeliScope,真正實現了單分子測序。但其高達99.9萬美元的售價阻礙了它的推廣,到2012年11月中旬,Helicos正式宣布破產。
Oxford Nanopore,2012年2月份,Oxford Nanopore發布了一系列納米孔DNA測序和蛋白質分析數據,並向外界展示了它的GridION TM系統和MinIONTM設備,但產業化仍未實現。
- Nanopore納米孔測序的基本原理是:
在充滿了電解液的納米級小孔兩端加上一定的電壓(一般為100~120 mV)時,可以很容易地測量通過此納米孔的電流強度。納米孔的直徑非常細小(約2.6 nm),只能允許 單個核苷酸通過,在核苷酸通過時,納米孔被核苷酸阻斷,通過的電流強度隨之變弱。
由於4種核苷酸鹼基的帶電性質不同,它們在通過納米孔時,被減弱的電流強度變化程度也就有所不同。這樣,由多個核苷酸組成的長鏈DNA或者RNA在電場的作用下由負極向正極方向移動並通過納米孔時,檢測通過納米孔的電流強度變化,即可判斷通過納米孔的核苷酸種類,從而實現了實時測序。
Pacific Biosciences,是目前市場接受度和使用度最高的三代測序儀,它以SMRT Cell為測序載體進行測序反應。
SMRT Cell是一張厚度為100 nm的金屬片,一面帶有15萬個(2014年數據)直徑為幾十納米的小孔,稱為零模波導(zero-mode waveguide,ZMW),也可以簡稱為納米孔。測序時,系統將測序文庫、DNA聚合酶和帶有不同熒光標記的dNTP放置到納米孔的底部進行DNA合成反應。DNA聚合酶分子通過共價結合的方式固定在納米孔底部,通常一個納米孔固定一個DNA聚合酶分子和一條DNA模板。加入DNA聚合反應所需底物——4種帶有四色熒光標記基團的dNTP及緩沖液。根據模板鏈核苷酸順序,相應的dNTP進入DNA模板鏈、引物和聚合酶復合物中發生鏈延伸反應,同時通過檢測dNTP熒光信號,獲得熒光信號圖像,經計算分析獲得DNA鹼基順序。每個SMRT Cell大約可以同時進行12萬個以上的單分子測序反應。
- Pacbio核心技術:
第一,零模波導孔技術(Zero-Mode Waveguides,ZMWs)讓光只能照亮固定了單個DNA聚合酶/模板分子的納米孔底部。
第二,磷酸化的核苷酸可幫助固定的DNA聚合酶完成一個全天然的DNA鏈合成過程。
Pacbio測序儀比較
到目前為止,PacBio公司基於SMRT測序技術共推出了三款測序儀。
- 第一款產品PacBio RS在2011年正式發布並商用;
- 2013年4月發布了升級版PacBio RS Ⅱ;
- 2015年10月推出全新升級的三代測序儀PacBio Sequel測序系統。
目前RS系統已停止生產,國內很多公司正在積極引進的Sequel平台,其原理與RS II System相同,但是測序通量和數據質量有了大幅提高。新平台的引進與應用還需要一段時間,因此目前市面上使用最廣泛的仍然是RS II System。
PacBio三代測序基本流程
PacBio三代測序的優勢
- 超長讀長:PacBio Sequel平台最大讀長能達到70kb,平均讀長12~15kb,能夠完美跨越高重復區域和高復雜區域,減少拼接成本。。
- 一致性序列准確:通過reads的自我矯正,30X以上准確率能夠達到99.999%。PacBio平台上目前的錯誤主要是插入和缺失,只有大概1%是substitution。缺失錯誤源自於有時候鹼基摻入速度過快,超過了PacBio相機的拍攝幀數。插入錯誤源自於有的時候酶隨機的選擇一些鹼基,但並未將這些鹼基真的摻入合成鏈中。由於這些錯誤是隨機的,因而可以隨着測序覆蓋深度的增加而消除。因此,盡管PacBio的單分子單次讀取的原始准確度並不非常高,但隨着測序覆蓋深度的增加,它可以獲得比NGS平台更高的一致性准確度。
- 均勻的覆蓋:無需PCR 擴增,避免了覆蓋度不均一和PCR 冗余,完全跨過高GC 含量區域,實現對整個基因組的均勻覆蓋。
- 直接檢測鹼基修飾:可以直接檢測到甲基化信息,同步進行表觀遺傳學性別識別。當鹼基有額外修飾時,DNA聚合酶的合成速度會減慢,對應的信號會被檢測出來。每種鹼基修飾事件都會使聚合酶的“停頓模式”PacBio Sequel產生微小差異,最終反映到熒光脈沖信號的間隔上。除了甲基化修飾,還可以檢測5-hC、5-hmU、5-hU、1-mA、6-mA、8-oxoA、BPDE、6-mT、6-mG等鹼基修飾,甚至可以鑒別傳統亞硫酸氫鹽測序法無法區分的甲基化修飾和羥甲基化修飾。PacBio Sequel平台可以在測序的同時即可檢測表觀遺傳學修飾信息,只需對測序數據選擇合適的軟件即可分析鹼基修飾信息。
- 以單分子分辨率表征復雜群體:為區分同一樣本中序列相近的DNA分子產生了分子內的一致性序列的測序模式,稱為環狀一致性測序(CCS),可用於用於各種復雜群體的應用,還有iso-seq。
PacBio分析應用
1、從頭組裝
2、重測序和變異檢測
3、RNA測序
4、表觀遺傳
5、多重分析
參考