用bcftools將多個vcf文件合並成一個vcf文件 或將多個vcf和合並成的vcf文件拆分成單個樣本的vcf文件


1. 軟件的安裝

a. bcftools 的安裝

b. bgzip的安裝: https://blog.csdn.net/weixin_30471065/article/details/95108525

下載鏈接:https://github.com/samtools/htslib/releases/download/1.2.1/htslib-1.2.1.tar.bz2

2. 合並

第一步: 

用bgzip將所有的vcf文件壓縮

bgzip -c -f f_nist_1_2.vcf > f_nist_1_2.vcf.gz

第二步:

用bcftools 對每一個壓縮好的vcf文件建立index

bcftools index f_nist_1_2.vcf.gz

第三步:

用bcftools將壓縮好的所有vcf文件進行合並

bcftools merge fc_nist_1_1.vcf.gz fc_nist_1_2.vcf.gz fc_nist_1_3.vcf.gz fc_nist_1_4.vcf.gz fc_nist_2_1.vcf.gz fc_nist_2_2.vcf.gz fc_nist_2_3.vcf.gz fc_nist_2_4.vcf.gz -Oz -o merge.vcf.gz

任務完成,得到最后合並好的vcf文件。

bcftools文件的一些使用方法:

http://www.htslib.org/doc/1.0/bcftools.html

bgzip的使用方法參考網址:

http://www.htslib.org/doc/bgzip.html

 

拆分成單個樣本的vcf文件:

1、下載安裝bcftools

2、准備樣本ID文件,這里命名為samplelistname.txt,一個樣本一行,如下所示:

sample1

sample2

sample3

3、輸入命令:

bcftools view -S samplelistname.txt /1000genomes/ALL.chr16.phase3_shapeit2_mvncall_integrated_v5a.20130502.genotypes.vcf.gz -Ov > samplelist_1000Genomes.vcf


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM