一次性計算多個表型的遺傳相關性(LDSC, GCTA)


遺傳相關的計算之前介紹過幾次了,感興趣的翻之前的推文:

1、利用GCTA工具計算復雜性狀/特征(Complex Trait)的遺傳相關性(genetic correlation)

2、LD SCore計算基因多效性、遺傳度、遺傳相關性

之前的兩篇推文均有一個小局限,就是針對多個表型間的遺傳相關性計算沒有介紹。

因此,本次推文是作為一個補充。

一、LDSC

對於LDSC,多表型間的遺傳相關性計算很簡單,假設存在trait1、trait2、trait3、trait4四個表型,其對應的sumstats格式文件為:
trait1.sumstats.gz,trait2.sumstats.gz,trait3.sumstats.gz,trait4.sumstats.gz

(sumstats格式文件不了解?見推文LD SCore計算基因多效性、遺傳度、遺傳相關性

現在想要計算trait1、trait2、trait3、trait4四個表型兩兩之間的遺傳相關性,則直接輸入命令:

for i in $(seq 0 4); do
echo $i
nohup ldsc.py --rg trait${i%}.sumstats.gz,trait1.sumstats.gz,trait2.sumstats.gz,trait3.sumstats.gz,trait4.sumstats.gz --ref-ld-chr chr/ --w-ld-chr chr/ --out --out trait${i%}linearcorr &
done

二、GCTA

GCTA一次只能計算某個表型(例如trait1)與其他所有表型(例如trait2、trait3、trait4)的遺傳相關性。

pheno.txt文件的格式如下所示:

先計算trait1與trait2、trait3、trait4的遺傳相關性:

for i in $(seq 1 4); do
echo $i
nohup gcta64 --reml-bivar 1 $i --reml-bivar-nocove --grm test --pheno pheno.txt  --reml-bivar-lrt-rg 0 --out trait1_${i%} &
done

--reml-bivar 1 $i #1指的是pheno.txt文件的第一個表型trait1。

$i將被執行4次(見$(seq 1 4)),分別執行的內容是計算trait1和pheno.txt文件的第一個表型(trait1)的遺傳相關性、trait1和pheno.txt文件的第二個表型(trait2)的遺傳相關性、trait1和trait3的遺傳相關性,trait1和trait4的遺傳相關性。

--grm test見推文利用GCTA工具計算復雜性狀/特征(Complex Trait)的遺傳相關性(genetic correlation)

計算trait2與trait1、trait3、trait4的遺傳相關性:

for i in $(seq 1 4); do
echo $i
nohup gcta64 --reml-bivar 2 $i --reml-bivar-nocove --grm test --pheno pheno.txt  --reml-bivar-lrt-rg 0 --out trait2_${i%} &
done

其他的以此類推。

其實也可以在for里面再套一個for循環,這樣就能一次性計算完所有的表型間的遺傳相關性。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM