為什么需要做meta分析
群體分層是GWAS研究中一個比較常見的假陽性來源.
也就是說,如果數據存在群體分層,卻不加以控制,那么很容易得到一堆假陽性位點。
當群體出現分層時,常規手段就是將分層的群體獨立分析,最后再做meta分析。
1.如何判斷群體是否分層
先用plink計算PCA,具體方法詳見鏈接:GWAS群體分層 (Population stratification):利用plink對基因型進行PCA
隨后畫出PC1和PC2在不同群體的散點圖,觀察群體之間是否明顯分開,如果明顯分開,說明群體分層了,需要獨立做關聯分析,最后再做meta分析
2.如何做meta分析
這里推薦metal軟件做meta分析,理由是簡單、易上手。
2.1 下載metal
進入下載鏈接
metal 提供了三個版本的,分別是Linux,macOS, Windows系統;請自行選擇。
這里提供Linux系統的命令:
wget http://csg.sph.umich.edu/abecasis/metal/download/Linux-metal.tar.gz
2.2 解壓metal
解壓用到的命令如下:
tar -zxvf Linux-metal.tar.gz
2.3 meta分析前的數據准備
假定需要進行meta分析的文檔分別為DGI_three_regions.txt
和 magic_SARDINIA.tbl
DGI_three_regions.txt
的內容如下:
magic_SARDINIA.tbl
的內容如下:
那么在meta分析前需要准備一個metal.txt文檔,metal.txt文檔的內容如下:
解釋一下,這個txt文檔是什么意思。
這一部分指的是MARKER對應的是DGI_three_regions.txt
文檔的SNP
列名;
WEIGHT對應的是DGI_three_regions.txt
文檔的N
列名;
其他的以此類推;
第二個文件的准備方法也是一樣的。
2.4 meta分析
很簡單的一個命令行就搞定了
metal metal.txt
2.5 結果解讀
meta分析后會生成兩個文件,分別是 METAANALYSIS1.TBL 和 METAANALYSIS1.TBL.info
METAANALYSIS1.TBL
是meta分析的結果文檔;
內容如下:
P-value
即為meta后的關聯分析P值;
METAANALYSIS1.TBL.info
是meta分析的說明文檔,比如 Marker
指的是什么。
其內容如下: