用bcftools将多个vcf文件合并成一个vcf文件 或将多个vcf和合并成的vcf文件拆分成单个样本的vcf文件


1. 软件的安装

a. bcftools 的安装

b. bgzip的安装: https://blog.csdn.net/weixin_30471065/article/details/95108525

下载链接:https://github.com/samtools/htslib/releases/download/1.2.1/htslib-1.2.1.tar.bz2

2. 合并

第一步: 

用bgzip将所有的vcf文件压缩

bgzip -c -f f_nist_1_2.vcf > f_nist_1_2.vcf.gz

第二步:

用bcftools 对每一个压缩好的vcf文件建立index

bcftools index f_nist_1_2.vcf.gz

第三步:

用bcftools将压缩好的所有vcf文件进行合并

bcftools merge fc_nist_1_1.vcf.gz fc_nist_1_2.vcf.gz fc_nist_1_3.vcf.gz fc_nist_1_4.vcf.gz fc_nist_2_1.vcf.gz fc_nist_2_2.vcf.gz fc_nist_2_3.vcf.gz fc_nist_2_4.vcf.gz -Oz -o merge.vcf.gz

任务完成,得到最后合并好的vcf文件。

bcftools文件的一些使用方法:

http://www.htslib.org/doc/1.0/bcftools.html

bgzip的使用方法参考网址:

http://www.htslib.org/doc/bgzip.html

 

拆分成单个样本的vcf文件:

1、下载安装bcftools

2、准备样本ID文件,这里命名为samplelistname.txt,一个样本一行,如下所示:

sample1

sample2

sample3

3、输入命令:

bcftools view -S samplelistname.txt /1000genomes/ALL.chr16.phase3_shapeit2_mvncall_integrated_v5a.20130502.genotypes.vcf.gz -Ov > samplelist_1000Genomes.vcf


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM