全基因組關聯分析學習資料(GWAS tutorial)


前言

很多人問我有沒有關於全基因組關聯分析(GWAS)原理的書籍或者文章推薦。

其實我個人覺得,做這個分析,先從跑流程開始,再去看原理。

為什么這么說呢,因為對於初學者來說,跑流程就像一個大黑洞,學習原理就像一個小黑洞。

很多人花了好幾個月的時間在看原理,一旦丟給他數據去分析,依舊束手無策。

不會跑流程,內心依舊會很恐慌。就像從來沒有入門一樣。

所以,我的建議是咱們先不去管原理,直接從分析入手。

等把數據跑出來了,整個流程的技能點滿了,再去看看它的原理。

入門:學習GWAS的在線網站:

對於沒有編程基礎的人來說,建議先從一個在線的網站走一遍GWAS流程。

這樣就能知道完成GWAS需要多少個步驟,心里大概有個底。

easygwas網站提供了公共數據,可以直接開始分析GWAS。整個流程按照網站提示,很簡單。

網址:https://easygwas.ethz.ch/

進階備選1:在linux下學習GWAS的實操數據

由於我們最終還是需要拿着自己的數據完成GWAS分析,不必避免的需要一定的編程基礎。

在線網站只是一個提供理解GWAS流程的網站,因此,我們還是需要在linux系統下拿一些數據練練手。學會最基本的命令行。

在這里,我推薦一個提供linux下學習GWAS的教程:GWA_tutorial.

網址:https://github.com/MareesAT/GWA_tutorial/

網站分為四個教程:1)GWAS的數據QC; 2)處理群體分層; 3)關聯分析(GWAS); 4)多基因風險得分分析(Polygenic risk score analyses)

示例數據都有了,就等你自己上手了。

我敢保證,當你能完整的跑完這個流程的時候,你對GWAS的理解少說也有70% ,下一個在群里幫我解答問題的大神就是你了(申請進群方式見公眾號菜單欄)。

進階備選2:使用R語言做GWAS分析

有些人對R語言可能比較熟悉,這里提供了一個用R語言分析GWAS的流程。

該流程有:GWAS的QC,PCA分析,Manhattan圖,QQ圖,候選位點的功能分析

感興趣的看這個:Genome-wide association studies in R

網址:https://www.r-bloggers.com/genome-wide-association-studies-in-r/

進階備選3

0 原理

啊,全基因組關聯分析(GWAS)的計算原理,了解一下?

1 分析流程

GWAS分析基本流程及分析思路

2 數據處理

2.1 數據質量過濾

GWAS基因芯片數據預處理:質量控制(quality control)

2.2 正負鏈翻轉(stand flip)

數據合並,踩不完的坑

2.3 基因型數據填補(imputation)

soga,網頁版的基因型填充可以這么做(genotype imputation)

2.4 群體分層校正

GWAS群體分層 (Population stratification):利用plink對基因型進行PCA

EIGENSTRAT除了用來計算PCA,還可以干嘛

群體遺傳分析分層校正,該選用多少個PCA?

3 關聯分析

GWAS: 曼哈頓圖,QQ plot 圖,膨脹系數( manhattan、Genomic Inflation Factor)

4 meta分析

只用一行命令,就可以學會全基因組關聯分析(GWAS)的meta分析

5 條件分析

GWAS條件分析(conditional analysis):作用,步驟,結果解讀

6 基因多效性

啊啊救救我,為何我的QQ圖那么飄(全基因組關聯分析)

7 GWAS后續分析

SNP在世界地圖上的頻率分布

GWAS:拒絕假陽性之case和control數量比例嚴重失衡的解決方案(SAIGE模型的應用)

GWAS后續分析:LocusZoom圖的繪制

利用GCTA工具計算復雜性狀/特征(Complex Trait)的遺傳相關性(genetic correlation)

GWAS系列分析:多基因風險評分(Polygenic Risk Score)的計算

有相關性就有因果關系嗎,教你玩轉孟德爾隨機化分析

LD SCore計算基因多效性、遺傳度、遺傳相關性

查詢、下載GWAS目錄數據的R包(gwasrapidd)

DEPICT實現基因優化、gene set富集分析、組織富集分析(tissue enrichment)

SNP功能注釋網站合集

8 相關文獻閱讀

常見變異影響常見疾病,罕見變異影響罕見疾病?

什么!GWAS研究中case和control的比例是有講究的?

阿爾茲海默症和代謝指標在大規模全基因組數據的遺傳共享研究

GWAS文獻解讀:The stability of educational achievement

全基因組關聯分析(GWAS)掃不出信號怎么辦(文獻解讀)

補充

GWAS其他教程:

www.transplantdb.eu/sites/transplantdb.eu/files/HandsOnTutorialtoGWAS_Seren-030715.pdf

https://doc.goldenhelix.com/SVS/tutorials/snp_gwas/index.html

ccbb.jnu.ac.in/IUBDDJan2015/workshop_files/GWAS Tutorial.pdf

https://www.r-project.org/conferences/useR-2009/slides/Zhao+Tan.pdf

users.du.se/~lrn/NOVAComputerExercises/NOVA_GenABEL_tutorial.pdf

gsea4gwas-v2.psych.ac.cn/docs/tutorial.jsp

www.montefiore.ulg.ac.be/~kvansteen/GeneticEpi-UA2/Class5/Introduction to GenABEL.pdf

看看文獻,加深對GWAS的理解:

A tutorial on conducting genome‐wide association studies: Quality control and statistical analysis

Genome-wide association studies and beyond

Genome-wide association studies


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM