FASTQ格式的每第四行表示這條序列的質量值。用ACSII碼表示。
測序儀一般是按照熒光信號來判斷所測序的鹼基是哪一種的,例如紅黃藍綠分別對應ATCG,因此對每個結果的判斷都是一個概率的問題。
Phred Quality Score Probability of incorrect base call Base call accuracy
10 1 in 10 90 %
20 1 in 100 99 %
30 1 in 1000 99.9 %
40 1 in 10000 99.99 %
50 1 in 100000 99.999 %
最初Sanger中心用Phred Quality Score來衡量該read中每個鹼基的質量,Q=-10logP ,其中P代表該鹼基被測序錯誤的概率,如果該鹼基測序出錯的概率為0.001,則Q應該為30,那么30+33=63,那么63對應的ASCii碼為“?”,則在該鹼基對應的質量值即“?”。
Solexa系列測序儀使用不同的公示來計算質量值:Q=-10log(P/1-P)
在測序質量較高時,這兩個算法得到的Q值沒有顯著差異。如下圖所示
不同測序平台,在表示質量值時選擇的字符區段也有差異:
Sanger = Q+33;Solexa = Q+64
來源:https://blog.csdn.net/godsunshine/article/details/51946314