前言 关于选用多少个PCA做群体分层校正,各大期刊并没有一个统一的说法。 故做了如下综述。 1 随心所欲型,想选多少就选多少 PCA想选多少就选多少,这个真的不是开玩笑。有文献出处有真相! 比如下面文献直接选用10个PCA校正群体分层。 Largest GWAS of PTSD ...
一 为什么要做祖先成分的PCA GWAS研究时经常碰到群体分层的现象,即该群体的祖先来源多样性,我们知道的,不同群体SNP频率不一样,导致后面做关联分析的时候可能出现假阳性位点 不一定是显著信号位点与该表型有关,可能是与群体SNP频率差异有关 ,因此我们需要在关联分析前对该群体做PCA分析,随后将PCA结果作为协变量加入关联分析中。 二 怎么做PCA 首先prune一下 plink bfile f ...
2019-03-06 17:07 0 2575 推荐指数:
前言 关于选用多少个PCA做群体分层校正,各大期刊并没有一个统一的说法。 故做了如下综述。 1 随心所欲型,想选多少就选多少 PCA想选多少就选多少,这个真的不是开玩笑。有文献出处有真相! 比如下面文献直接选用10个PCA校正群体分层。 Largest GWAS of PTSD ...
如果想将基因型转化为0,1,2 可以使用命令:plink --bfile file --recodeA --out recodefile 如果想将基因型转化为0,1 可以使用命令:plink --bfile file --recodeD --out recodefile 如果想将基因型同时转化 ...
在全基因组关联分析中,处理芯片数据时,必须走的一个流程就是基因型数据填充(imputation)。 当然,如果你拿到的是全测序的数据,请忽略这一步。 下面直奔主题,怎么在网页版进行基因型填充。 1 进入Michigan Imputation Server Michigan ...
该选择多少个主成分 群体结构(population structure),或者说群体分层(population stratification),是由于个体之间非随机交配而导致的群体中亚群之间等位基因频率的系统差异。这种系统差异,是全基因组关联研究(GWAS)中影响非常大的混淆变量,可以造成非常大 ...
基因型过滤标准:保留双等位基因(biallelic sites)以及次等位基因频率大于0.05的位点: bcftools view --types snps -m 2 -M 2 -q 0.05:minor genotypes.chr22.vcf | bgzip -c > ...
当我们进行群体遗传分析时,得到vcf后,可利用plink进行主成分(PCA)分析; 一、软件安装 二、使用流程 第一步:将vcf转换为plink格式 上述会得到.map, .nosex和.ped结尾的三个文件。 第二步 ...
归纳总结:伴X遗传,雄性中Xb的基因频率等于基因型频率,在雌性中,Xb基因频率也等于雄性中Xb基因的频率。因为雌性有两条X染色体,其遗传符合遗传平衡定律,即:(P+Q)²=P²+2PQ+Q²=1,P代表代表XB ‚Q代表Xb,P²代表XBXB,2PQ代表XBXb,Q代表XbXb。 ...
首先,下载SHAPEIT. 按照里面的步骤安装完后,将vcf文件进行基因型定相,分四步走。 第一步,将vcf文件转化为plink二进制文件(.bed, .bim, .fam)。 这一步需要用到GATK里的GenomeAnalysisTK工具,见如下命令: java -Xmx8g ...