轉錄組表達量計RPKM、FPKM、TPM說明


在轉錄組測序(RNA-Seq)中,基因的表達量是我們關注的重點。基因表達量的衡量指標有:RPKM、FPKM、TPM。

RPKM:Reads Per Kilobase Million;說實話,這個英文說明真的很費解,其實可以理解為“Reads Per Kilobase Per Million Reads”​,即“每一百萬條Reads中,對基因的每1000個Base而言,比對到該1000個base的Reads數”,計算公式。

 

FPKM:Fragments per Kilobase Million,FPKM意義與RPKM極為相近。二者區別僅在於,Fragment 與 Read。RPKM的誕生是針對早期的SE測序,FPKM則是在PE測序上對RPKM的校正。只要明確​Reads 和 Fragments的區別,RPKM和FPKM的概念便易於區分。Reads即是指下機后fastq數據中的每一條Reads,Fragments則是指每一段用於測序的核酸片段,在SE中,一個Fragments只測一條Reads,所以,Reads數與Fragments數目相等;在PE中,一個Fragments測兩端,會得到2條Reads,但由於后期質量或比對的過濾,有可能一個Fragments的2條Reads最后只有一條進入最后的表達量分析。總之,對某一對Reads而言,這2條Reads只能算一個Fragments,所以,Fragment的最終數目是Reads的1到2倍之間。

 

TPM:​Transcripts Per Million,這個英文也很費解。先不糾結字面意思了,直接解釋它的計算方法。TPM的計算分3步:

step1:根據基因/轉錄本長度​校正count值;假設某基因count值為R1,則校正后count值為:

R1/(L1/1000)​;  

注: L1為該基因的長度;

step2:計算total 校正后count值;即所有基因的校正后count值​總和,Rtotal;

step3:計算TPM;TPM​結果為:

R1*1000*1000000/(L1*​Rtoatl)。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM