illumina和sanger測序質量值體系的差異


 

FASTQ格式的每第四行表示這條序列的質量值。用ACSII碼表示。

 

測序儀一般是按照熒光信號來判斷所測序的鹼基是哪一種的,例如紅黃藍綠分別對應ATCG,因此對每個結果的判斷都是一個概率的問題。


Phred Quality Score Probability of incorrect base call Base call accuracy
10 1 in 10 90 %
20 1 in 100 99 %
30 1 in 1000 99.9 %
40 1 in 10000 99.99 %
50 1 in 100000 99.999 %
最初Sanger中心用Phred Quality Score來衡量該read中每個鹼基的質量,Q=-10logP ,其中P代表該鹼基被測序錯誤的概率,如果該鹼基測序出錯的概率為0.001,則Q應該為30,那么30+33=63,那么63對應的ASCii碼為“?”,則在該鹼基對應的質量值即“?”。

Solexa系列測序儀使用不同的公示來計算質量值:Q=-10log(P/1-P)

在測序質量較高時,這兩個算法得到的Q值沒有顯著差異。如下圖所示

 

不同測序平台,在表示質量值時選擇的字符區段也有差異:

Sanger = Q+33;Solexa = Q+64

 

來源:https://blog.csdn.net/godsunshine/article/details/51946314

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM