利用GCTA工具計算復雜性狀/特征(Complex Trait)的遺傳相關性(genetic correlation)


如文章“Genome-wide Complex Trait Analysis(GCTA)-全基因組復雜性狀分析”中介紹的GCTA,是一款基於全基因組關聯分析發展的分析工具,除了計算不同性狀/表型間(traits)的遺傳相關性外,還可以計算親緣關系、近交系數……,下面簡單介紹如何利用GCTA計算不同性狀/表型的遺傳相關性。

一,在Linux上安裝GCTA工具:

wget -r -np -pk -nH -P ./to/your/path/way/gcta http://cnsgenomics.com/software/gcta/gcta_1.26.0.zip #在Linux下下載GCTA工具
unzip gcta_1.26.0.zip #解壓GCTA工具

“wget -r -np -pk -nH -P”命令完全照搬,“./to/your/path/way/gcta”是指你想把GCTA軟件下載在哪個路徑,按個人需求適當修改。

二、准備PLINK二進制格式文件,比如 test.fam, test.bim test.bed 

三、生成 test.grm.bintest.grm.N.bintest.grm.id 格式文件

/gcta/gcta64 --bfile test --autosome --make-grm --out test #生成grm格式文件,方便后面的遺傳相關性分析

“/gcta/gcta64”指GCTA軟件的位置

“--make-grm”指生成 test.grm.bintest.grm.N.bin和test.grm.id 格式文件

“--out test”指輸出的文件名為test

四、准備性狀/表型文件,后綴為.txt格式,不需要表頭,第一列為family ID, 第二列為individual ID 第三列和第四列為 phenotypes ,類似於PLINK的表型文件格式

五、計算遺傳相關性

gcta/gcta64 --reml-bivar --reml-bivar-nocove --grm test --pheno pheno.txt --reml-bivar-lrt-rg 0 --out test

得到test.hsq 格式的文件

test.hsp文件內容如下:

Source Variance SE
V(G)_tr1 0.479647 0.179078  #trait 1 的遺傳方差和標准誤
V(G)_tr2 0.286330 0.181329   #trait 2 的遺傳方差和標准誤
C(G)_tr12 0.230828 0.147958  #trait 1 和 2 之間的遺傳協方差和標准誤
V(e)_tr1 0.524264 0.176650  #trait 1 的剩余方差和標准誤
V(e)_tr2 0.734654 0.181146  #trait 2 的剩余方差和標准誤
C(e)_tr12 0.404298 0.146863  #trait 1 和 2 的剩余協方差和標准誤
Vp_tr1 1.003911 0.033202
Vp_tr2 1.020984 0.033800
V(G)/Vp_tr1 0.477779 0.176457
V(G)/Vp_tr2 0.280445 0.176928
rG 0.622864 0.217458  # 遺傳相關性和標准誤
n 3669  # 樣本量

其中,rG即為我們想要的遺傳相關性,0.622864 和 0.217458分別代表兩個性狀/表型間的遺傳相關性(genetic correlation)和標准誤(Stand error)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM