原文:GWAS研究中case和control的比例是有讲究的?

GWAS研究中,表型分两种。第一种是线性的表型,如果身高 体重 智力等 第二种是二元的表型,比如患病和未患病,即通常所说的case和control。对于表型是线性的样本来说,是不存在case和control比例不平衡的情况的,但是对于表型是二元的样本,比如疾病和对照组 健康人群 ,case和control比例失衡,可能会出现N多的假阳性结果。具体看看下面的例子。 例子 :case和control比 ...

2019-03-29 14:38 3 927 推荐指数:

查看详情

GWAS:拒绝假阳性之casecontrol数量比例严重失衡的解决方案(SAIGE模型的应用)

一、为什么要校正casecontrol数量比例不平衡情况 试问作为生信届人员,最怕的是什么,当然是统计结果不靠谱。统计结果不靠谱包括两方面:一个是假阴性,一个是假阳性。假阴性可以理解为白天鹅被误当成丑小鸭了,假阳性可以理解为一大堆青蛙,你不知道哪个才是你的真命天子。假阴性就罢了,最多让你错过 ...

Tue Apr 02 19:49:00 CST 2019 0 896
GWAS的名称概念

基因: 基因型: 单倍型 二倍体: 等位基因: 杂合体: 纯合体: 同源染色体: 连锁不平衡: 基因分型: 次等位基因频率MAF: 参 ...

Sat Jun 01 00:38:00 CST 2019 0 577
GWAS研究可利用的数据库(20200424更新)

1、列表包括数据库名称、表型、是否能下载到基因型(genotype)、是否能下载到GWAS结果文件(P值、效应值、SNP位点)。目前收集到的有如下: 参考到这些数据库的文献:Genome-wide association study identifies 74 loci associated ...

Sun Apr 29 04:03:00 CST 2018 0 3576
GWAS summary数据SNP的rsid匹配

SNP的rsid匹配 在处理 Nealelab 的summary data sets时,发现数据缺失SNP对应rs号: 可以看到数据只有variant变量,这里提供了解决方案:https://www.biostars.org/p/349284/ ,实践一下! Getting ...

Mon Oct 19 04:33:00 CST 2020 0 518
GWAS基因芯片数据预处理:质量控制(quality control

一、数据为什么要做质量控制 比起表观学研究GWAS研究很少有引起偏差的来源,一般来说,一个人的基因型终其一生几乎不会改变的,因此很少存在同时影响表型又影响基因型的变异。但即便这样,我们在做GWAS时也要去除一些可能引起偏差的因素。 这种因素主要有:群体结构、个体间存在血缘关系、技术性操作 ...

Wed Mar 20 19:38:00 CST 2019 0 2307
ORDER BY 高级用法之CASE WHEN继续研究

  之前项目需求遇到一个复杂排序使用到了order by case when,由于新来的后端不懂,所以我自己研究了下,见之前博客:查询排序:order by case when理解、在order By子句中使用case语句的理解   其实当时看到这篇博客(ORDER BY 高级用法之CASE ...

Fri Jul 31 20:34:00 CST 2020 0 533
GWAS分析结果pvalue/p.ajust为0时如何处理?

GWAS分析的结果,偶尔会遇到到pvalue为0的SNP位点,这时如果直接做曼哈顿或QQ图,会出错,因为log0无意义。 此时,该如何处理? 如果你用的是Plink1.9来做的GWAS,可加一个参数: --output-min-p 1e-99,即将小于1e-99的pvalue都当成 ...

Wed May 05 05:43:00 CST 2021 0 976
bashcase的用法

看到一些很实用的脚本,由于之前对于bash脚本的积累都比较离散,没有一个全面的了解,在这里记录一下: bash的case语句用法 case语句的语法规则是: 注意的是, case比较的是pattern,然后既然是通配符,那么: 切记通配符本身不能用引号括起来。 而对于变量 ...

Fri Jun 07 23:00:00 CST 2019 0 978
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM