一行命令學會全基因組關聯分析(GWAS)的meta分析


為什么需要做meta分析

群體分層是GWAS研究中一個比較常見的假陽性來源.

也就是說,如果數據存在群體分層,卻不加以控制,那么很容易得到一堆假陽性位點。

當群體出現分層時,常規手段就是將分層的群體獨立分析,最后再做meta分析。

1.如何判斷群體是否分層

先用plink計算PCA,具體方法詳見鏈接:GWAS群體分層 (Population stratification):利用plink對基因型進行PCA

隨后畫出PC1和PC2在不同群體的散點圖,觀察群體之間是否明顯分開,如果明顯分開,說明群體分層了,需要獨立做關聯分析,最后再做meta分析

2.如何做meta分析

這里推薦metal軟件做meta分析,理由是簡單、易上手。

2.1 下載metal

進入下載鏈接

metal 提供了三個版本的,分別是Linux,macOS, Windows系統;請自行選擇。

這里提供Linux系統的命令:

wget http://csg.sph.umich.edu/abecasis/metal/download/Linux-metal.tar.gz

2.2 解壓metal

解壓用到的命令如下:

tar -zxvf Linux-metal.tar.gz

2.3 meta分析前的數據准備

假定需要進行meta分析的文檔分別為DGI_three_regions.txtmagic_SARDINIA.tbl

DGI_three_regions.txt 的內容如下:

VCxxyj.jpg

magic_SARDINIA.tbl 的內容如下:

VCxzOs.jpg

那么在meta分析前需要准備一個metal.txt文檔,metal.txt文檔的內容如下:

VCzpmn.jpg

解釋一下,這個txt文檔是什么意思。

這一部分指的是MARKER對應的是DGI_three_regions.txt文檔的SNP列名;

WEIGHT對應的是DGI_three_regions.txt文檔的N列名;

其他的以此類推;

第二個文件的准備方法也是一樣的。

2.4 meta分析

很簡單的一個命令行就搞定了

metal metal.txt

2.5 結果解讀

meta分析后會生成兩個文件,分別是 METAANALYSIS1.TBL 和 METAANALYSIS1.TBL.info

METAANALYSIS1.TBL 是meta分析的結果文檔;

內容如下:

VCz9wq.jpg

P-value 即為meta后的關聯分析P值;

METAANALYSIS1.TBL.info 是meta分析的說明文檔,比如 Marker 指的是什么。

其內容如下:

VCzFYT.jpg


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM