測序領域常用名詞解釋


kb=千鹼基 kilobase 
nt=核苷酸 nucleotide 
bp=鹼基對 base pair
 
高通量測序
高通量測序技術(High-throughput sequencing,HTS),有些文獻中稱其為下一代測序技術(next generation sequencing,NGS),又被稱為深度測序(Deep sequencing)
 
基因組重測序(Genome Re-sequencing)
全基因組重測序是對基因組序列已知的個體進行基因組測序,並在個體或群體水平上進行差異性分析的方法
 
de novo測序
也稱為從頭測序
 
外顯子測序(whole exon sequencing)
 
mRNA測序(RNA-seq)
 
small RNA測序
Small RNA(micro RNAs、siRNAs和 pi RNAs)
 
miRNA(microRNA)測序
 
Chip-seq
染色質免疫共沉淀技術(ChromatinImmunoprecipitation,ChIP)也稱結合位點分析法
 
CHIRP-Seq
CHIRP-Seq(Chromatin Isolation by RNA Purification)是一種檢測與RNA綁定的DNA和蛋白的高通量測序方法
 
metagenomic(宏基因組)
 
Read
高通量測序平台產生的序列標簽就稱為reads
 
Contig
拼接軟件基於reads之間的overlap區,拼接獲得的序列稱為Contig(重疊群)
 
Contig N50
Reads拼接后會獲得一些不同長度的Contigs。將所有的Contig長度相加,能獲得一個Contig總長度。然后將所有的Contigs按照從長到短進行排序,如獲得Contig 1,Contig 2,Contig 3...………Contig 25。將Contig按照這個順序依次相加,當相加的長度達到Contig總長度的一半時,最后一個加上的Contig長度即為Contig N50。舉例:Contig 1+Contig 2+ Contig 3+Contig 4=Contig總長度*1/2時,Contig 4的長度即為Contig N50。Contig N50可以作為基因組拼接的結果好壞的一個判斷標准
 
Scaffold
基因組de novo測序,通過reads拼接獲得Contigs后,往往還需要構建454 Paired-end庫或lllumina Mate-pair庫,以獲得一定大小片段(如3Kb、6Kb、10Kb、20Kb)兩端的序列。基於這些序列,可以確定一些Contig之間的順序關系,這些先后順序已知的Contigs組成Scaffold
 
Scaffold N50
Scaffold N50與Contig N50的定義類似。Contigs拼接組裝獲得一些不同長度的Scaffolds。將所有的Scaffold長度相加,能獲得一個Scaffold總長度。然后將所有的Scaffolds按照從長到短進行排序,如獲得Scaffold 1,Scaffold 2,Scaffold 3...………Scaffold 25。將Scaffold按照這個順序依次相加,當相加的長度達到Scaffold總長度的一半時,最后一個加上的Scaffold長度即為Scaffold N50。舉例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold總長度*1/2時,Scaffold 5的長度即為Scaffold N50。Scaffold N50可以作為基因組拼接的結果好壞的一個判斷標准
 
測序深度和覆蓋度
測序深度是指測序得到的總鹼基數與待測基因組大小的比值。假設一個基因大小為2M,測序深度為10X,那么獲得的總數據量為20M。覆蓋度是指測序獲得的序列占整個基因組的比例。由於基因組中的高GC、重復序列等復雜結構的存在,測序最終拼接組裝獲得的序列往往無法覆蓋所有的區域,這部分沒有獲得的區域就稱為Gap。例如一個細菌基因組測序,覆蓋度是98%,那么還有2%的序列區域是沒有通過測序獲得的
 
轉錄本重構
用測序的數據組裝成轉錄本。有兩種組裝方式:1,de-novo構建; 2,有參考基因組重構


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM