plink --bfile file --extract all.snp --r2 --ld-window-kb 1000 --ld-window-r2 0.8 --ld-snp-list all.snp --out all.snp.08.inter all.snp文件如下所示: ...
PLINK提供了 ld 的参数计算两个SNP位点的连锁不平衡值。 命令如下: plink file file ld rs rs out rs rs 生成如下数据: ld rs rs : R sq . D Haplotype Frequency Expectation under LE TG . CG . . TA . . CA . . In phase alleles are TA CG ...
2019-04-29 16:11 0 1779 推荐指数:
plink --bfile file --extract all.snp --r2 --ld-window-kb 1000 --ld-window-r2 0.8 --ld-snp-list all.snp --out all.snp.08.inter all.snp文件如下所示: ...
本文首发于“生信补给站”,https://mp.weixin.qq.com/s/Gl6BChxSYbSHMo9oMpufPg 连锁不平衡图,用来可视化不同SNP之间的连锁程度,前同事间俗称“倒三角”图。 本文使用自己的数据,因为安装R包后使用内置数据集运行出结果较容易 ...
哈代-温伯格平衡定律(Hardy-Weinberg equilibrium),即HW平衡,是指对于一个大且随机交配的种群,基因频率和基因型频率在没有迁移、突变和选择的条件下会保持不变。它是建立在一个理想的群体模式上的,有四个假设前提:1.群体无限大;2.随机婚配;3.没有突变;4.没有大规模迁移 ...
最近需要画LD block,之前一直用haploview软件画,haploview软件毛病比较多,比如不能有多态位点,输入的变异位点不能太多等。动不动就报错。 最近试了一下另外一个画LD block的软件LDBlockShow,比haploview好用许多。不需要自己剔除多态位点,直接输入vcf ...
GWAS入门必看教程:Statistical analysis of genome-wide association (GWAS) data 名词解释和基本问题: 关联分析:就是AS的中文,全称是GWAS。应用基因组中数以百万计的单核苷酸多态;SNP为分子遗传标记,进行全基因组水平 ...
1、测试数据 2、计算观测杂合度和期待杂合度 ...
数据不平衡 1.什么是数据不平衡 一般都是假设数据分布是均匀的,每种样本的个数差不多,但是现实情况下我们取到的数据并不是这样的,如果直接将分布不均的数据直接应用于算法,大多情况下都无法取得理想的结果。 这里着重考虑二分类,因为解决了二分类种的数据不平衡问题后,推而广之酒能得到多分类情况下 ...
最近有需求,对WGS测序获得SNP信息进行筛减,可问题是测序个体少,call rate,maf,hwe,等条件过滤后,snp数量还是千万级别,所以后面利用plink工具根据LD信息来滤除大量SNP标记。 工具版本:PLINK v1.90b4.6 64-bit (15 Aug 2017) 一、格式 ...