一、Independent significant SNPs 和 Lead SNPs 定義
Independent significant SNPs: P 值小於 5e-8 的 SNP 位點,且 SNP 位點之間的 r2<0.6(注意,這里的 r2 指的是 LD 的 r2 值,不是相關性哦,別誤解了,0.6 也是我設定的,不同文獻給定的 r2 值不一樣,主流設定是 0.6 )
Lead SNPs: Independent significant SNPs 中 r2 值小於 0.1 的 SNP(同樣的,這里的 0.1 也是我設定的,不同文獻閾值不一樣,主流設定是 0.1 )
如果文字描述還不清楚的話,請看圖片版的:
在 locus1 中,SNP1, SNP2, SNP3都達到了顯著水平(P< 5e-8),SNP1 和 SNP2 的 r2=0.8, SNP2 和 SNP3 的 r2=0.4, SNP1 和 SNP3 的 r2=0.15。
假定我們設定 Independent significant SNPs 的閾值為:P<5e-8 且 r2<0.6,那么locus1 只有 SNP1 和 SNP3 是 Independent significant SNPs。
假定我們設定 Lead SNPs 的閾值為:r2 < 0.1,那么只有SNP3是Lead SNPs
看明白其中的邏輯了嗎,也就是說,Lead SNPs 的數量一定是小於等於 Independent significant SNPs 的數量,因為 Lead SNPs 是在 Independent significant SNPs 的基礎上進行了二次clump。
以上,就是 Independent significant SNPs 和 Lead SNPs 的定義。
二、FUMA 鑒定 Independent SNPs 和 Lead SNPs
理解了 Independent significant SNPs 和 Lead SNPs 的定義后,我們就可以借助工具鑒定 Independent significant SNPs 和 Lead SNPs。
目前挺多工具支持 Independent significant SNPs 和 Lead SNPs 的識別,比如PLINK。
我來推薦一個比較友好的網頁工具 FUMA(https://fuma.ctglab.nl/snp2gene) 。
進入網址:https://fuma.ctglab.nl/snp2gene 后,
只需要輸入 GWAS summary 文件,就可以得到 Independent significant SNPs 和 Lead SNPs。
步驟一:上傳 GWAS summary文件,把 GWAS summary 文件的表頭信息(比如染色體,位置,rs號等)補充在下圖中
步驟二:設定 Independent significant SNPs 和 Lead SNPs 的閾值
步驟三:點擊 submit job, 然后就可以等結果了
三、輸出文件
以下是 FUMA 網站給出的 Independent significant SNPs 和 Lead SNPs 結果: