一般來說,一個bam文件通常只包含一個樣本的信息,最多需要進行染色體位置的處理, samtools也提供了簡單的處理方式,比如要提取 chr1的reads, 只需要:
samtools view input.bam ch1
這幾天遇到了10x genomics的bam結果,發現單細胞的reads全包含在一個bam文件里,用barcode進行區分,因此可能就需要提取其中的信息,比如提起某一個細胞的reads,那么可以:
samtools view possorted_genome_bam.bam -h | sed -n "/^@\|TCTGAGAAGAAACCAT-1/p" | samtools view -b > result.bam
其實就是多了 sed 的處理過程 ,之所以加以記錄,是因為在處理過程中
samtools -h
保留的header在將sam結果轉化會bam格式是必須的,以防下次忘記.