參考:
https://zhuanlan.zhihu.com/p/61963366
一、目的
講解二代測序如何從很短的reads拼接為一個完整的基因組(雙端測序,如何對 paired-end 進行拼接)
二、單端測序
測序中最簡單的辦法,只有一種測序引物,使得PCR只能沿着這個引物的方向進行,所有的reads都只能按照一個方向進行讀取。但是這帶來了一些問題,以illumina為例,測序的質量會隨着測序的進行而下降,所以reads越向后越不准確;后來,研究者們想出來的解決辦法就是雙端測序,對一個長為500bp的序列,單端測序下游質量會很差,但是從兩個方向上分別測250bp-300bp然后再拼接起來,就可以大大提高測序的准確率了。
三、雙端測序
雙端測序的接頭序列比較復雜,首先在兩個方向上分別進行測序,就需要有兩個不同方向的測序引物(下圖Rd1 SP和Rd2 SP);其次,為了區別兩個方向的reads(分為read1和read2),其中一個測序引物前面要添加一小段index序列進行標記。
在雙端測序中,每一個read的長度都要超過整個待測序列的一半。所以。可以根據兩個reads重合的部分進行拼接: