MR-PRESSO是18年發在Nature Genetics上的一個檢驗水平基因多效性的方法Detection of widespread horizontal pleiotropy in causal relationships inferred from Mendelian randomization between complex traits and diseases
,目前該文章的引用有343次。
1、為什么要檢驗水平多效性
孟德爾隨機化分析有三個假設,其中的一個假設就是工具變量(一般是遺傳位點)必須通過暴露因素(exposure,大胸)影響結果(outcome,不愛運動)。
如果工具變量可以不通過暴露因素直接影響結果,那么就違反了孟德爾隨機化的思想,即檢驗結果存在水平多效性。
上面一段話是不是很拗口,用直白的話說,就是假定SNP位點rs123同時與大胸顯著相關(暴露因素),又同時與不愛運動顯著相關(結局變量),那么我們就認為用rs123進行大胸和不愛運動的因果關系推斷是存在水平多效性的,檢驗結果即便是顯著,他們之間的因果關系也不成立。
所以,用孟德爾隨機化進行因果關系推斷的大前提是沒有水平多效性。
講完理論知識,下面具體講講如何用MR-PRESSO檢驗水平多效性。
2、使用MR-PRESSO檢驗水平多效性
下載、安裝:
if (!require("devtools")) { install.packages("devtools") } else {}
devtools::install_github("rondolab/MR-PRESSO",force = TRUE)
加載數據:
library(MRPRESSO)
data(SummaryStats)
示例數據如下所示:
E1, E2, Y 分別表示暴露因素1,暴露因素2,結局變量;
effect,se, pval分別表示效應值,效應值的誤差,P值;
准備好以上文件后,分析表露因素E1和結局變量Y的水平多效性:
mr_presso(BetaOutcome = "Y_effect", BetaExposure = "E1_effect", SdOutcome = "Y_se", SdExposure = "E1_se", OUTLIERtest = TRUE, DISTORTIONtest = TRUE, data = SummaryStats, NbDistribution = 1000, SignifThreshold = 0.05)
如果想檢驗多變量MR和結局變量的水平多效性,則用命令:
mr_presso(BetaOutcome = "Y_effect", BetaExposure = c("E1_effect", "E2_effect"), SdOutcome = "Y_se", SdExposure = c("E1_se", "E2_se"), OUTLIERtest = TRUE, DISTORTIONtest = TRUE, data = SummaryStats, NbDistribution = 1000, SignifThreshold = 0.05)
3、結果解讀
結果如下所示:
MR-PRESSO results
$Global Test
$Pvalue即為我們檢測的水平多效性,P值小於0.05,說明暴露因素和結局變量存在水平多效性。
關於孟德爾隨機化的例子請參考之前的文章有相關性就有因果關系嗎,教你玩轉孟德爾隨機化分析