1. 軟件的安裝
a. bcftools 的安裝
b. bgzip的安裝: https://blog.csdn.net/weixin_30471065/article/details/95108525
下載鏈接:https://github.com/samtools/htslib/releases/download/1.2.1/htslib-1.2.1.tar.bz2
2. 合並
第一步:
用bgzip將所有的vcf文件壓縮
bgzip -c -f f_nist_1_2.vcf > f_nist_1_2.vcf.gz
第二步:
用bcftools 對每一個壓縮好的vcf文件建立index
bcftools index f_nist_1_2.vcf.gz
第三步:
用bcftools將壓縮好的所有vcf文件進行合並
bcftools merge fc_nist_1_1.vcf.gz fc_nist_1_2.vcf.gz fc_nist_1_3.vcf.gz fc_nist_1_4.vcf.gz fc_nist_2_1.vcf.gz fc_nist_2_2.vcf.gz fc_nist_2_3.vcf.gz fc_nist_2_4.vcf.gz -Oz -o merge.vcf.gz
任務完成,得到最后合並好的vcf文件。
bcftools文件的一些使用方法:
http://www.htslib.org/doc/1.0/bcftools.html
bgzip的使用方法參考網址:
http://www.htslib.org/doc/bgzip.html
拆分成單個樣本的vcf文件:
1、下載安裝bcftools。
2、准備樣本ID文件,這里命名為samplelistname.txt,一個樣本一行,如下所示:
sample1
sample2
sample3
3、輸入命令:
bcftools view -S samplelistname.txt /1000genomes/ALL.chr16.phase3_shapeit2_mvncall_integrated_v5a.20130502.genotypes.vcf.gz -Ov > samplelist_1000Genomes.vcf