1.supplementary alignment
supplementary alignment是指一條read的一部分和參考區域1比對成功,另一部分和參考區域2比對成功,參考區域1和參考區域2沒有交集(或很少),那么一條read就會產生兩條sam文件,
將其中的一條sam文件作為represent alignment,而另一條作為supplementary alignment (flag為2048)。
將上面的fastq文件去跑bwa,read有兩條sam文件,第二條的flag值為2048:
2.bwa mem的-M -Y參數:
-M:mark shorter split hits as secondary。就是把supplemenary alignment 變為no primary(flag值256) 。下面是bwa mem -M的結果
-Y:use soft clipping for supplementary alignments。把默認的hard clip變為soft clip。hard clip 不會顯示不匹配的鹼基串,soft clip會顯示不匹配的鹼基串。下面是bwa mem -Y的結果(58H34M變為58S34M)
3.secondary(no primary)是指這條read在基因組上有多個匹配區域(>=2),可以是read是的同一部分有不同匹配區域,也可以是一條read上的不同區域。所以supplemenary aligment應該算是secondary的子集。
許多處理bam的軟件不會去處理supplemenary(split alignments),比如Picard’s markDuplicates,所以可能需要用-M把supplemenary 轉換為secondary。