最近有需求,对WGS测序获得SNP信息进行筛减,可问题是测序个体少,call rate,maf,hwe,等条件过滤后,snp数量还是千万级别,所以后面利用plink工具根据LD信息来滤除大量SNP标记。 工具版本:PLINK v1.90b4.6 64-bit (15 Aug 2017) 一、格式 ...
一 合并文件 plink合并文件需要用到 merge 参数 如果是ped和map格式文件,则用以下命令: plink file data merge data .ped data .map recode out merge 如果是二进制文件和ped,map格式文件,则用以下命令: plink bfile data merge data .ped data .map make bed out mer ...
2019-01-16 11:49 3 1934 推荐指数:
最近有需求,对WGS测序获得SNP信息进行筛减,可问题是测序个体少,call rate,maf,hwe,等条件过滤后,snp数量还是千万级别,所以后面利用plink工具根据LD信息来滤除大量SNP标记。 工具版本:PLINK v1.90b4.6 64-bit (15 Aug 2017) 一、格式 ...
上位置为122-124范围的位点 cat variants.vcf | java -jar Sn ...
plink --bfile file --extract all.snp --r2 --ld-window-kb 1000 --ld-window-r2 0.8 --ld-snp-list all.snp --out all.snp.08.inter all.snp文件如下所示: ...
纯合SNP和杂合SNP是SNP calling软件如GATK或者SAMtools根据测序深度、碱基质量值、比对质量值和基因型质量值等综合判断出来的纯合和杂合, 简单来说,纯合SNP可以认为该位点测到的所有reads只是一种碱基类型,杂合SNP为二种或二种以上的碱基类型,不排除特殊位置 ...
本文转载于https://www.jianshu.com/p/e6d5dd774c6e SNP位点过滤 SNP过滤有两种情况,一种是仅根据位点质量信息(测序深度,回帖质量等)对SNP进行粗过滤。如果使用GATK对重测序结果进行SNP calling,那么可以考虑下面的标准 QD< ...
通用过滤 Vcftools(http://vcftools.sourceforge.net) 对vcf文件进行过滤 第一步:过滤最低质量低于30,次等位基因深度(minor allele count)不少于3 第二步:上述结果文件 ...
SNP命名 【2016-11-24】 奶茶妹妹是谁,京东老板娘,咦?章泽天!没错! 国民老公是谁?万达少东家,王健林儿子,王思聪!恭喜你又答对了! 函数是谁?这不是 ...
做群体变异检测后,通常会有提取子集的操作,之前没有发现bcftools有这个功能,都是自己写脚本操作,数据量一上来,速度真的是让人无语凝噎。这里记录下提取子vcf文件的用法,软件版本:bcftools-1.5 一、根据个体提取子集 根据样品名提取vcf文件,准备要保留的个体名文件 ...