如文章“Genome-wide Complex Trait Analysis(GCTA)-全基因組復雜性狀分析”中介紹的GCTA,是一款基於全基因組關聯分析發展的分析工具,除了計算不同性狀/表型間(traits)的遺傳相關性外,還可以計算親緣關系、近交系數……,下面簡單介紹如何利用GCTA計算不同性狀/表型的遺傳相關性。
一,在Linux上安裝GCTA工具:
wget -r -np -pk -nH -P ./to/your/path/way/gcta http://cnsgenomics.com/software/gcta/gcta_1.26.0.zip #在Linux下下載GCTA工具 unzip gcta_1.26.0.zip #解壓GCTA工具
“wget -r -np -pk -nH -P”命令完全照搬,“./to/your/path/way/gcta”是指你想把GCTA軟件下載在哪個路徑,按個人需求適當修改。
二、准備PLINK二進制格式文件,比如 test.fam, test.bim 和 test.bed
三、生成 test.grm.bin, test.grm.N.bin和test.grm.id 格式文件
/gcta/gcta64 --bfile test --autosome --make-grm --out test #生成grm格式文件,方便后面的遺傳相關性分析
“/gcta/gcta64”指GCTA軟件的位置
“--make-grm”指生成 test.grm.bin, test.grm.N.bin和test.grm.id 格式文件
“--out test”指輸出的文件名為test
四、准備性狀/表型文件,后綴為.txt格式,不需要表頭,第一列為family ID, 第二列為individual ID 第三列和第四列為 phenotypes ,類似於PLINK的表型文件格式
五、計算遺傳相關性
gcta/gcta64 --reml-bivar --reml-bivar-nocove --grm test --pheno pheno.txt --reml-bivar-lrt-rg 0 --out test
得到test.hsq 格式的文件
test.hsp文件內容如下:
Source Variance SE
V(G)_tr1 0.479647 0.179078 #trait 1 的遺傳方差和標准誤
V(G)_tr2 0.286330 0.181329 #trait 2 的遺傳方差和標准誤
C(G)_tr12 0.230828 0.147958 #trait 1 和 2 之間的遺傳協方差和標准誤
V(e)_tr1 0.524264 0.176650 #trait 1 的剩余方差和標准誤
V(e)_tr2 0.734654 0.181146 #trait 2 的剩余方差和標准誤
C(e)_tr12 0.404298 0.146863 #trait 1 和 2 的剩余協方差和標准誤
Vp_tr1 1.003911 0.033202
Vp_tr2 1.020984 0.033800
V(G)/Vp_tr1 0.477779 0.176457
V(G)/Vp_tr2 0.280445 0.176928
rG 0.622864 0.217458 # 遺傳相關性和標准誤
n 3669 # 樣本量
其中,rG即為我們想要的遺傳相關性,0.622864 和 0.217458分別代表兩個性狀/表型間的遺傳相關性(genetic correlation)和標准誤(Stand error)