原文:plink 进行PCA分析

当我们进行群体遗传分析时,得到vcf后,可利用plink进行主成分 PCA 分析 一 软件安装 二 使用流程 第一步:将vcf转换为plink格式 上述会得到.map, .nosex和.ped结尾的三个文件。 第二步:基于.ped生成一个bed文件 二进制文件 上述得到.bim, .bed 结尾的两个文件 第三步:PCA分析 上述得到.eigenval 和.eigenvec 结尾的两个文件,其中. ...

2020-04-26 14:00 0 3506 推荐指数:

查看详情

GWAS群体分层 (Population stratification):利用plink对基因型进行PCA

一、为什么要做祖先成分的PCA? GWAS研究时经常碰到群体分层的现象,即该群体的祖先来源多样性,我们知道的,不同群体SNP频率不一样,导致后面做关联分析的时候可能出现假阳性位点(不一定是显著信号位点与该表型有关,可能是与群体SNP频率差异有关),因此我们需要在关联分析前对该群体做PCA分析 ...

Thu Mar 07 01:07:00 CST 2019 0 2575
运用sklearn进行主成分分析(PCA)代码实现

运用sklearn进行主成分分析(PCA)代码实现   一、前言及回顾   二、sklearn的PCA类介绍   三、分类结果区域可视化函数   四、10行代码完成葡萄酒数据集分类   五、完整代码   六、总结 一、前言及回顾 从上一篇《PCA数据降维原理 ...

Thu Aug 13 00:50:00 CST 2020 0 1293
plink 阈性状(质量性状)GWAS分析

plink进行阈性状(质量性状)关联分析有两种方法 --assoc 和 --logistic, 这两种方法又分别有分是否校正: --assoc --adjust 和 --logistic --adjust --logistic方法有可以选择是否添加协变量: --logistic ...

Sat Dec 18 07:47:00 CST 2021 0 1692
R语言PCA分析

学生身体4 项指标的主成份分析 excel数据 学生序号 x1身高 x2体重 x3胸围 x4坐高 1 148 41 72 78 ...

Tue Jun 19 01:08:00 CST 2012 0 11086
PCA分析和因子分析

#由此说明使用prcomp函数时,必须使用标准化过的原始数据。如果使用没有标准化的raw数据(不是相关系数矩阵或者协方差矩阵),必须将参数scale. = T <result>$sdev ...

Fri Apr 29 05:11:00 CST 2016 0 2541
在Python中使用K-Means聚类和PCA主成分分析进行图像压缩

各位读者好,在这片文章中我们尝试使用sklearn库比较k-means聚类算法和主成分分析PCA)在图像压缩上的实现和结果。 压缩图像的效果通过占用的减少比例以及和原始图像的差异大小来评估。 图像压缩的目的是在保持与原始图像的相似性的同时,使图像占用的空间尽可能地减小,这由图像的差异百分比 ...

Thu Apr 09 21:43:00 CST 2020 0 889
运用PCA进行降维的好处

运用PCA对高维数据进行降维,有一下几个特点: (1)数据从高维空间降到低维,因为求方差的缘故,相似的特征会被合并掉,因此数据会缩减,特征的个数会减小,这有利于防止过拟合现象的出现。但PCA并不是一种好的防止过拟合的方法,在防止过拟合的时候,最好是对数据进行正则化; (2)使用降维的方法,使 ...

Wed Mar 30 17:12:00 CST 2016 0 1808
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM