。 2、运行plink软件,命令如下: plink --file test --sheep --pca 5 h ...
当我们进行群体遗传分析时,得到vcf后,可利用plink进行主成分 PCA 分析 一 软件安装 二 使用流程 第一步:将vcf转换为plink格式 上述会得到.map, .nosex和.ped结尾的三个文件。 第二步:基于.ped生成一个bed文件 二进制文件 上述得到.bim, .bed 结尾的两个文件 第三步:PCA分析 上述得到.eigenval 和.eigenvec 结尾的两个文件,其中. ...
2020-04-26 14:00 0 3506 推荐指数:
。 2、运行plink软件,命令如下: plink --file test --sheep --pca 5 h ...
一、为什么要做祖先成分的PCA? GWAS研究时经常碰到群体分层的现象,即该群体的祖先来源多样性,我们知道的,不同群体SNP频率不一样,导致后面做关联分析的时候可能出现假阳性位点(不一定是显著信号位点与该表型有关,可能是与群体SNP频率差异有关),因此我们需要在关联分析前对该群体做PCA分析 ...
运用sklearn进行主成分分析(PCA)代码实现 一、前言及回顾 二、sklearn的PCA类介绍 三、分类结果区域可视化函数 四、10行代码完成葡萄酒数据集分类 五、完整代码 六、总结 一、前言及回顾 从上一篇《PCA数据降维原理 ...
plink进行阈性状(质量性状)关联分析有两种方法 --assoc 和 --logistic, 这两种方法又分别有分是否校正: --assoc --adjust 和 --logistic --adjust --logistic方法有可以选择是否添加协变量: --logistic ...
学生身体4 项指标的主成份分析 excel数据 学生序号 x1身高 x2体重 x3胸围 x4坐高 1 148 41 72 78 ...
#由此说明使用prcomp函数时,必须使用标准化过的原始数据。如果使用没有标准化的raw数据(不是相关系数矩阵或者协方差矩阵),必须将参数scale. = T <result>$sdev ...
各位读者好,在这片文章中我们尝试使用sklearn库比较k-means聚类算法和主成分分析(PCA)在图像压缩上的实现和结果。 压缩图像的效果通过占用的减少比例以及和原始图像的差异大小来评估。 图像压缩的目的是在保持与原始图像的相似性的同时,使图像占用的空间尽可能地减小,这由图像的差异百分比 ...
运用PCA对高维数据进行降维,有一下几个特点: (1)数据从高维空间降到低维,因为求方差的缘故,相似的特征会被合并掉,因此数据会缩减,特征的个数会减小,这有利于防止过拟合现象的出现。但PCA并不是一种好的防止过拟合的方法,在防止过拟合的时候,最好是对数据进行正则化; (2)使用降维的方法,使 ...