一、為什么要做GWAS的條件分析(conditional analysis)
我們做GWAS的時候,經常掃出一堆顯著的信號,假設rs121是我們掃出來與某表型最顯著相關的位點(P=1.351e-36),rs124尾隨其后(6.673e-22),也是與該表型顯著相關,那么這個時候,我們就有問題了:這個rs124位點是真的與該表型顯著相關,還是因為rs124與rs121高度連鎖不平衡(linkage disequilibrium)。換句話說,rs124之所以出類拔萃,是因為它本身厲害,還是有rs121提拔,導致我們看到的結果是:rs124永遠跟隨者rs121水漲船高。為了解決這個問題,我們就需要做條件分析。
二、GWAS的條件分析(conditional analysis)步驟
如果你有全基因組關聯分析的基礎的話,條件分析的工作則很簡單,只需要在原來的基礎上加上“--condition”的參數,具體為:
如果表型為case/control的情況:
./plink --bfile ./data --condition rs121 --logistic --pheno ./pheno.txt --mpheno 1 --covar ./covar.txt --covar-number 1.2 --out ./gwas_condition
如果表型為連續性變量的情況:
./plink --bfile ./data --condition rs121 --linear --pheno ./pheno.txt --mpheno 1 --covar ./covar.txt --covar-number 1.2 --out ./gwas_condition
三、結果解讀
一般來說,有兩種結果。
第一種,條件分析以后,rs124不顯著了;
這種情況說明rs124是因為rs121才導致信號顯著。
第二種,條件分析以后,rs124依舊顯著;
這種情況說明rs124確實與表型相關,跟rs121沒有關系。
參考鏈接:
https://www.biostars.org/p/190006/
https://biology.stackexchange.com/questions/7871/what-does-conditional-analysis-of-a-snp-in-a-gwa-study-entail