原文:PCA方法校正群体结构(群体分层),GWAS该用多少个主成分?

该选择多少个主成分 群体结构 population structure ,或者说群体分层 population stratification ,是由于个体之间非随机交配而导致的群体中亚群之间等位基因频率的系统差异。这种系统差异,是全基因组关联研究 GWAS 中影响非常大的混淆变量,可以造成非常大的假阳性。 举个简单的模拟例子 ,当 GWAS 中不存在群体分层时,得到的结果会是比较真实可靠的: 当样 ...

2020-11-16 16:55 0 2023 推荐指数:

查看详情

GWAS群体分层校正,该选用多少个PCA

前言 关于选用多少个PCA群体分层校正,各大期刊并没有一个统一的说法。 故做了如下综述。 1 随心所欲型,想选多少就选多少 PCA想选多少就选多少,这个真的不是开玩笑。有文献出处有真相! 比如下面文献直接选用10个PCA校正群体分层。 Largest GWAS of PTSD ...

Sat Apr 27 20:52:00 CST 2019 0 812
GWAS群体分层 (Population stratification):利用plink对基因型进行PCA

一、为什么要做祖先成分PCA? GWAS研究时经常碰到群体分层的现象,即该群体的祖先来源多样性,我们知道的,不同群体SNP频率不一样,导致后面做关联分析的时候可能出现假阳性位点(不一定是显著信号位点与该表型有关,可能是与群体SNP频率差异有关),因此我们需要在关联分析前对该群体PCA分析 ...

Thu Mar 07 01:07:00 CST 2019 0 2575
群体结构分析

群体结构图形——structure堆叠图 2016/05/17 分享到: 之前基迪奥已经为大家介绍过群体结构两种图形——PCA图和系统发生树,今天我们来介绍最后一种图形——structure堆叠图 ...

Sun Oct 28 18:55:00 CST 2018 0 5018
admixture 群体结构分析

tructure是与PCA、进化树相似的方法,就是利用分子标记的基因型信息对一组样本进行分类,分子标记可以是SNP、indel、SSR。相比于PCA,进化树,群体结构分析可明确各个群之间是否存在交流及交流程度 1 软件安装 2 简单使用 第一步:将VCF变为plink格式 ...

Sat Jan 30 22:55:00 CST 2021 0 870
群体结构图形三剑客——PCA

重测序便宜了,群体的测序和分析也多了起来。群体结构分析,是重测序最常见的分析内容。群体结构分析应用十分广泛,首先其本身是群体进化关系分析里面最基础的分析内容,其次在进行GWAS分析的时候,本身也需要使用PCA或structure分析的结果作为协变量,来校正群体结构对关联分析带来的假阳性 ...

Mon Dec 12 07:02:00 CST 2016 0 21912
PCA成分分析方法

PCA: Principal Components Analysis,成分分析。 1、引入   在对任何训练集进行分类和回归处理之前,我们首先都需要提取原始数据的特征,然后将提取出的特征数据输入到相应的模型中。但是当原始数据的维数特别高时,这时我们需要先对数据进行降维处理,然后将降维后的数据 ...

Sat Aug 01 04:56:00 CST 2015 3 7018
PCA(成分分析)方法浅析

PCA(成分分析)方法浅析 降维、数据压缩 找到数据中最重要的方向:方差最大的方向,也就是样本间差距最显著的方向 PCA算法主要用于降维,就是将样本数据从高维空间投影到低维空间中,并尽可能的在低维空间中表示原始数据。PCA的几何意义可简单解释为: 原文链接:https ...

Sun Dec 01 04:38:00 CST 2019 0 270
PCA——成分分析

  PCA(Principal Components Analysis)成分分析是一个简单的机器学习算法,利用正交变换把由线性相关变量表示的观测数据转换为由少量线性无关比变量表示的数据,实现降维的同时尽量减少精度的损失,线性无关的变量称为主成分。大致流程如下:   首先对给定数据集(数据是向量 ...

Tue May 26 07:22:00 CST 2020 1 537
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM