一、为什么要做祖先成分的PCA? GWAS研究时经常碰到群体分层的现象,即该群体的祖先来源多样性,我们知道的,不同群体SNP频率不一样,导致后面做关联分析的时候可能出现假阳性位点(不一定是显著信号位点与该表型有关,可能是与群体SNP频率差异有关),因此我们需要在关联分析前对该群体做PCA分析 ...
在全基因组关联分析中,处理芯片数据时,必须走的一个流程就是基因型数据填充 imputation 。 当然,如果你拿到的是全测序的数据,请忽略这一步。 下面直奔主题,怎么在网页版进行基因型填充。 进入Michigan Imputation Server Michigan Imputation Server网站链接:https: imputationserver.sph.umich.edu index ...
2019-05-08 10:15 0 1003 推荐指数:
一、为什么要做祖先成分的PCA? GWAS研究时经常碰到群体分层的现象,即该群体的祖先来源多样性,我们知道的,不同群体SNP频率不一样,导致后面做关联分析的时候可能出现假阳性位点(不一定是显著信号位点与该表型有关,可能是与群体SNP频率差异有关),因此我们需要在关联分析前对该群体做PCA分析 ...
归纳总结:伴X遗传,雄性中Xb的基因频率等于基因型频率,在雌性中,Xb基因频率也等于雄性中Xb基因的频率。因为雌性有两条X染色体,其遗传符合遗传平衡定律,即:(P+Q)²=P²+2PQ+Q²=1,P代表代表XB ‚Q代表Xb,P²代表XBXB,2PQ代表XBXb,Q代表XbXb。 ...
首先,下载SHAPEIT. 按照里面的步骤安装完后,将vcf文件进行基因型定相,分四步走。 第一步,将vcf文件转化为plink二进制文件(.bed, .bim, .fam)。 这一步需要用到GATK里的GenomeAnalysisTK工具,见如下命令: java -Xmx8g ...
如果想将基因型转化为0,1,2 可以使用命令:plink --bfile file --recodeA --out recodefile 如果想将基因型转化为0,1 可以使用命令:plink --bfile file --recodeD --out recodefile 如果想将基因型同时转化 ...
基因型过滤标准:保留双等位基因(biallelic sites)以及次等位基因频率大于0.05的位点: bcftools view --types snps -m 2 -M 2 -q 0.05:minor genotypes.chr22.vcf | bgzip -c > ...
一、芯片数据 此次拿到的illumina芯片数据并不是原始的数据,已经经过GenomeStudio软件处理成了finalreport文件,格式如下: 之前没处理过芯片数据,对于这种编码模式(Forward,top AB)的基因型数据很疑惑,查了很多资料,收效甚微。看过建明大神对芯片这块 ...
在合并数据过程当中,经常会发现不同来源的数据正负链不是统一的,这是一件很头疼的事。 正负链没有统一的情况下直接合并在一起会产生什么后果呢。 举个最简单的例子,假如我们从小明和小红分别拿到了一批基因型数据。那么存在以下几种可能:1)小明的基因型数据统一好正链或者负链;2)小红的基因型数据统一 ...
GWAS学习笔记——imputation的含义 (Truth of Imputation) Do not imput onther's sin to yourself scheme of imputation in statistics GWAS学习笔记 ...