1.SAM(sequence Alignment/mapping)數據格式是目前高通量測序中存放比對數據的標准格式,當然他可以用於存放未比對的數據
2.AMTools的主要功能如下:
-
view: BAM-SAM/SAM-BAM 轉換和提取部分比對
-
sort: 比對排序
-
merge: 聚合多個排序比對
-
index: 索引排序比對
-
faidx: 建立FASTA索引,提取部分序列
-
tview: 文本格式查看序列
-
pileup: 產生基於位置的結果和 consensus/indel calling
3.最常用的三板斧就是格式轉換,排序,索引
轉換:samtools view -S SRR3589912.sam -b > SRR3589912.bam(-S是最新版的samtools為了兼容以前的版本寫的)
排序:samtools sort SRR3589912.bam -o SRR3589912_sorted.bam
索引:samtools index SRR3589912_sorted.bam
從上述可以看出了,比對后的sam文件應該先進行格式的轉換,接着是排序,最后根據排序的文件建立索引文件。
4.samtools的排序方式有兩種(常用)
默認方式,按照染色體的位置進行排序
samtools sort test.bam default
參數-n則是根據read名進行排序。
samtools sort -n test.bam sort_left
5.samtools的view不就可以進行格式轉換,還可以進行數據的提取
例:提取1號染色體上1234~123456區域的以對read
samtools view SRR3589957_sorted.bam chr1:1234-123456 | head
參考網址:https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247484720&idx=1&sn=4bb3e3d2182ffe937d58dc135b4bbd24&chksm=9b48458bac3fcc9df23d7f84023eb371289d58a74a5237056c232cb23d6af6645516153d36e0&scene=21#wechat_redirect
