samtools的用法簡介


1.SAM(sequence Alignment/mapping)數據格式是目前高通量測序中存放比對數據的標准格式,當然他可以用於存放未比對的數據

2.AMTools的主要功能如下:

  • view: BAM-SAM/SAM-BAM 轉換和提取部分比對

  • sort: 比對排序

  • merge: 聚合多個排序比對

  • index: 索引排序比對

  • faidx: 建立FASTA索引,提取部分序列

  • tview: 文本格式查看序列

  • pileup: 產生基於位置的結果和 consensus/indel calling

3.最常用的三板斧就是格式轉換,排序,索引

轉換:samtools view -S SRR3589912.sam -b > SRR3589912.bam(-S是最新版的samtools為了兼容以前的版本寫的)

排序:samtools sort SRR3589912.bam -o SRR3589912_sorted.bam

索引:samtools index SRR3589912_sorted.bam

從上述可以看出了,比對后的sam文件應該先進行格式的轉換,接着是排序,最后根據排序的文件建立索引文件。

4.samtools的排序方式有兩種(常用)

默認方式,按照染色體的位置進行排序

samtools sort test.bam default

參數-n則是根據read名進行排序。

samtools sort -n test.bam sort_left

5.samtools的view不就可以進行格式轉換,還可以進行數據的提取

例:提取1號染色體上1234~123456區域的以對read

samtools view SRR3589957_sorted.bam chr1:1234-123456 | head

參考網址:https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247484720&idx=1&sn=4bb3e3d2182ffe937d58dc135b4bbd24&chksm=9b48458bac3fcc9df23d7f84023eb371289d58a74a5237056c232cb23d6af6645516153d36e0&scene=21#wechat_redirect

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM