使用bedtools提取vcf多個位置的變異(extract multi-region of genotypes by bedtools)


1、下載安裝bedtools

2、生成bed文件;標准的bed文件格式如下:

chr7    127471196  127472363  Pos1  0  +  127471196  127472363  255,0,0
chr7    127472363  127473530  Pos2  0  +  127472363  127473530  255,0,0
chr7    127473530  127474697  Pos3  0  +  127473530  127474697  255,0,0
chr7    127474697  127475864  Pos4  0  +  127474697  127475864  255,0,0

如果你只有染色體、起始位置和終止位置信息的話,也無大礙。不大標准但是不傷大雅的bed文件格式如下:

chr7    127471196  127472363 
chr7    127472363  127473530  
chr7    127473530  127474697  
chr7    127474697  127475864  

3、提取多個位置的vcf文件;

bedtools intersect -a myfile.vcf.gz -b mutil-region.bed -header > output.vcf

 







免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM