之前我寫過一篇文章群體遺傳分析分層校正,該選用多少個PCA?,里面提到可以通過EIGENSTRAT軟件確定顯著的主成分,后續就可以將顯著的主成分加入協變量中。
這篇文章主要是講如何通過EIGENSTRAT軟件確定顯著的主成分。
1下載安裝EIGENSTRAT
1.1 下載
下載地址:https://data.broadinstitute.org/alkesgroup/EIGENSOFT/EIG-6.1.4.tar.gz
wget https://data.broadinstitute.org/alkesgroup/EIGENSOFT/EIG-6.1.4.tar.gz
1.2 安裝
tar zxvf EIG-6.1.4.tar.gz
2 PCA計算
可以用plink計算PCA,也可以用EIGENSTRAT。
PLINK計算PCA比較簡便,個人比較推薦PLINK。
之前已經介紹過怎么用PLINK計算PCA了,這里就不再贅述。
3 確定顯著PCA數量
下面講一下怎么用EIGENSTRAT確定多少個PCA被納入協變量中。
3.1 如果是用EIGENSTRAT計算得到的PCA
用EIGENSTRAT計算得到后綴為.eval
的文件后,使用如下命令:
/bin/twstats -t twtable -i pca.eval -o eigenvaltw.out
3.2 如果是用PLINK計算得到的PCA
用PLINK計算的PCA得到后綴為.eigenval
的文件后,使用如下命令:
/bin/twstats -t twtable -i pca.eigenval -o eigenvaltw.out
3.3 結果解讀
假定生成的eigenvaltw.out如下:
這張圖里前三個PCA的P值小於0.05,說明做關聯分析的時候要把前三個PCA加入協變量中。