見命令: bcftools merge A.vcf.gz B.vcf.gz C.vcf.gz -Oz -o ABC.vcf.gz 參考鏈接:http://vcftools.sourceforge.net/htslib.html#merge ...
做群體變異檢測后,通常會有提取子集的操作,之前沒有發現bcftools有這個功能,都是自己寫腳本操作,數據量一上來,速度真的是讓人無語凝噎。這里記錄下提取子vcf文件的用法,軟件版本:bcftools . 一 根據個體提取子集 根據樣品名提取vcf文件,准備要保留的個體名文件 keep.list,一行一個個體 參考第三步 。 無痛處理,速度超快,命令如下: 二 根據染色體位置提取子集 注意:這里v ...
2019-11-27 21:24 0 989 推薦指數:
見命令: bcftools merge A.vcf.gz B.vcf.gz C.vcf.gz -Oz -o ABC.vcf.gz 參考鏈接:http://vcftools.sourceforge.net/htslib.html#merge ...
通過GATK calling出來的SNP如果使用UnifiedGenotype獲得的SNP文件是分sample的,但是如果使用vcftools或者ANGSD則需要Vcf文件是multi-sample的,這里就需要我們將不同samples的文件進行合並,可以通過vcftools的perl模塊進行 ...
1、下載安裝bcftools。 2、准備樣本ID文件,這里命名為samplelistname.txt,一個樣本一行,如下所示: sample1 sample2 sample3 3、輸入命令: bcftools view -S samplelistname.txt ...
在對vcf的操作有這樣三個軟件: 利用Bcftools按樣本拆分文件主要利用了“--view”這個軟件包,主要代碼如下: 這里面三個參數: 就可以完成了。 ...
1、bcftools提取指定區段的vcf文件 下載安裝bcftools 見如下命令: bcftools filter 1000Genomes.vcf.gz --regions 9:4700000-4800000 > 4700000-4800000.vcf 注意:輸入 ...
目錄 需求 示例文件 代碼實現 補充說明 需求 客戶的一個簡單需求: 我有一批功能基因位點,想從重測序的群體材料中找到這些位點,如何批量快速獲得? 示例文件 gene.txt test.vcf 代碼實現 run.sh ...
1. bgzip 壓縮 vcf 文件為 gz 文件 bgzip -c T8_B8_TN_20171226190133_TN_haplotyper.vcf >T8_B8_TN_20171226190133_TN_haplotyper.vcf.gzbgzip -c ...
shell命令: 其中counts是bcftools的一個插件(plugin) 后面接上的$filename即為需要查看的vcf文件 示例: 這里使用千牛基因組Run9數據做例子 shell命令和運行結果: REF https://samtools.github.io ...