处理bam文件提取信息


一般来说,一个bam文件通常只包含一个样本的信息,最多需要进行染色体位置的处理, samtools也提供了简单的处理方式,比如要提取 chr1的reads, 只需要:

samtools view input.bam ch1

 这几天遇到了10x genomicsbam结果,发现单细胞的reads全包含在一个bam文件里,用barcode进行区分,因此可能就需要提取其中的信息,比如提起某一个细胞的reads,那么可以:

samtools view possorted_genome_bam.bam -h | sed -n "/^@\|TCTGAGAAGAAACCAT-1/p" | samtools view -b > result.bam

其实就是多了 sed 的处理过程 ,之所以加以记录,是因为在处理过程中 

samtools -h

 保留的header在将sam结果转化会bam格式是必须的,以防下次忘记.


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM