本系列文章采用的数据集与代码来自https://github.com/MareesAT/GWA_tutorial。 该教程获得了许多人的推荐,是一份很详细的step-by-step guide。 本文将介绍该教程中的QC部分(1_QC_GWAS.zip),后续 ...
一 数据为什么要做质量控制 比起表观学研究,GWAS研究很少有引起偏差的来源,一般来说,一个人的基因型终其一生几乎不会改变的,因此很少存在同时影响表型又影响基因型的变异。但即便这样,我们在做GWAS时也要去除一些可能引起偏差的因素。 这种因素主要有:群体结构 个体间存在血缘关系 技术性操作。 二 怎么看数据是否需要进行质量控制 下面分别为样本和SNP位点在数据中的直方图,当数据不在绝大多数的分布当 ...
2019-03-20 11:38 0 2307 推荐指数:
本系列文章采用的数据集与代码来自https://github.com/MareesAT/GWA_tutorial。 该教程获得了许多人的推荐,是一份很详细的step-by-step guide。 本文将介绍该教程中的QC部分(1_QC_GWAS.zip),后续 ...
本系列文章采用的数据集与代码来自https://github.com/MareesAT/GWA_tutorial。 该教程获得了许多人的推荐,是一份很详细的step-by-step guide。 本文将介绍该教程中的QC部分(1_QC_GWAS.zip),后续或将继续添加有关QC ...
随着人类基因组计划(Human Genome Project)即全部核苷酸测序的即将完成,人类基因组研究的重心逐渐进入后基因组时代(Postgenome Era),向基因的功能及基因的多样性倾斜。通过对个体在不同生长发育阶段或不同生理状态下大量基因表达的平行分析,研究相应基因在生物体内的功能,阐明 ...
接前一篇: 用R和BioConductor进行基因芯片数据分析(五):芯片间归一化 经过一系列的预处理,包括缺失值填充,中位数计算以及归一化,我们的数据终于可以用啦。 下面我们就来分析一下new population和old population的个体是否有差异表达基因。 判断一个基因是否 ...
接前一篇: 用R和BioConductor进行基因芯片数据分析(三):计算median 归一化是从normalization翻译过来的。归一化的目的是使各次/组测量或各种实验条件下的测量可以相互比较,消除测量间的非实验差异。非实验差异可能来源于样品制备,点样,杂交过程,杂交信号处理等。 归一化 ...
接前一篇:用R和BioConductor进行基因芯片数据分析(四):芯片内归一化 上次进行了芯片内的归一化,但是我们的数据来自于10张芯片,为了让这10张芯片之间有可比性,需要进行芯片间归一化。 具体原理就不介绍了。 这里用到Bioconductor的一个package,叫做limma ...
1. 首先我们通过一些方法得到了如下的数据,基于篇幅以及为了教学隐去了其他一些信息。 2. 选中表达数据,执行 开始—条件格式—色阶 选择一个合适的色阶: 3. 选择好颜色之后得到了如下结果: 4. 怎么样,已经有热力图的基本样式了吧,我们需要把文字隐藏掉。首先选择数据区域 ...
基于边合成边测序(Sequencing By Synthesis,SBS)技术,Illumina HiSeq2500高通量测序平台对cDNA文库进行测序,能够产出大量的高质量Reads,测序平台产出的这些Reads或碱基称为原始数据(Raw Data),其大部分碱基质量打分能达到或超过Q30 ...