EIGENSTRAT計算PCA的顯著性


之前我寫過一篇文章群體遺傳分析分層校正,該選用多少個PCA?,里面提到可以通過EIGENSTRAT軟件確定顯著的主成分,后續就可以將顯著的主成分加入協變量中。

這篇文章主要是講如何通過EIGENSTRAT軟件確定顯著的主成分。

1下載安裝EIGENSTRAT

1.1 下載

下載地址https://data.broadinstitute.org/alkesgroup/EIGENSOFT/EIG-6.1.4.tar.gz

wget https://data.broadinstitute.org/alkesgroup/EIGENSOFT/EIG-6.1.4.tar.gz

1.2 安裝

tar zxvf EIG-6.1.4.tar.gz

2 PCA計算

可以用plink計算PCA,也可以用EIGENSTRAT。

PLINK計算PCA比較簡便,個人比較推薦PLINK。

之前已經介紹過怎么用PLINK計算PCA了,這里就不再贅述。

3 確定顯著PCA數量

下面講一下怎么用EIGENSTRAT確定多少個PCA被納入協變量中。

3.1 如果是用EIGENSTRAT計算得到的PCA

用EIGENSTRAT計算得到后綴為.eval的文件后,使用如下命令:

/bin/twstats -t twtable -i pca.eval -o eigenvaltw.out

3.2 如果是用PLINK計算得到的PCA

用PLINK計算的PCA得到后綴為.eigenval的文件后,使用如下命令:

/bin/twstats -t twtable -i pca.eigenval -o eigenvaltw.out

3.3 結果解讀

假定生成的eigenvaltw.out如下:

Z3eu7D.png

這張圖里前三個PCA的P值小於0.05,說明做關聯分析的時候要把前三個PCA加入協變量中。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM