本系列文章采用的數據集與代碼來自https://github.com/MareesAT/GWA_tutorial。 該教程獲得了許多人的推薦,是一份很詳細的step-by-step guide。 本文將介紹該教程中的QC部分(1_QC_GWAS.zip),后續 ...
一 數據為什么要做質量控制 比起表觀學研究,GWAS研究很少有引起偏差的來源,一般來說,一個人的基因型終其一生幾乎不會改變的,因此很少存在同時影響表型又影響基因型的變異。但即便這樣,我們在做GWAS時也要去除一些可能引起偏差的因素。 這種因素主要有:群體結構 個體間存在血緣關系 技術性操作。 二 怎么看數據是否需要進行質量控制 下面分別為樣本和SNP位點在數據中的直方圖,當數據不在絕大多數的分布當 ...
2019-03-20 11:38 0 2307 推薦指數:
本系列文章采用的數據集與代碼來自https://github.com/MareesAT/GWA_tutorial。 該教程獲得了許多人的推薦,是一份很詳細的step-by-step guide。 本文將介紹該教程中的QC部分(1_QC_GWAS.zip),后續 ...
本系列文章采用的數據集與代碼來自https://github.com/MareesAT/GWA_tutorial。 該教程獲得了許多人的推薦,是一份很詳細的step-by-step guide。 本文將介紹該教程中的QC部分(1_QC_GWAS.zip),后續或將繼續添加有關QC ...
隨着人類基因組計划(Human Genome Project)即全部核苷酸測序的即將完成,人類基因組研究的重心逐漸進入后基因組時代(Postgenome Era),向基因的功能及基因的多樣性傾斜。通過對個體在不同生長發育階段或不同生理狀態下大量基因表達的平行分析,研究相應基因在生物體內的功能,闡明 ...
接前一篇: 用R和BioConductor進行基因芯片數據分析(五):芯片間歸一化 經過一系列的預處理,包括缺失值填充,中位數計算以及歸一化,我們的數據終於可以用啦。 下面我們就來分析一下new population和old population的個體是否有差異表達基因。 判斷一個基因是否 ...
接前一篇: 用R和BioConductor進行基因芯片數據分析(三):計算median 歸一化是從normalization翻譯過來的。歸一化的目的是使各次/組測量或各種實驗條件下的測量可以相互比較,消除測量間的非實驗差異。非實驗差異可能來源於樣品制備,點樣,雜交過程,雜交信號處理等。 歸一化 ...
接前一篇:用R和BioConductor進行基因芯片數據分析(四):芯片內歸一化 上次進行了芯片內的歸一化,但是我們的數據來自於10張芯片,為了讓這10張芯片之間有可比性,需要進行芯片間歸一化。 具體原理就不介紹了。 這里用到Bioconductor的一個package,叫做limma ...
1. 首先我們通過一些方法得到了如下的數據,基於篇幅以及為了教學隱去了其他一些信息。 2. 選中表達數據,執行 開始—條件格式—色階 選擇一個合適的色階: 3. 選擇好顏色之后得到了如下結果: 4. 怎么樣,已經有熱力圖的基本樣式了吧,我們需要把文字隱藏掉。首先選擇數據區域 ...
基於邊合成邊測序(Sequencing By Synthesis,SBS)技術,Illumina HiSeq2500高通量測序平台對cDNA文庫進行測序,能夠產出大量的高質量Reads,測序平台產出的這些Reads或鹼基稱為原始數據(Raw Data),其大部分鹼基質量打分能達到或超過Q30 ...