孟德爾隨機化 Mendelian randomization,MR


孟德爾隨機化分析 Mendelian randomization,MR使用遺傳變異作為工具變量,推斷暴露因素與結局之間的因果關系,能有效克服混雜合反向因果問題所導致的偏倚。

1986年,Katan提出MR思想:由於配子形成時,遵循“親代等位基因隨機分配給子代”的孟德爾遺傳規律,如果基因型決定表型,基因型通過表型而與疾病發生關聯,因此可以使用基因型作為工具變量來推斷表型與疾病之間的關聯。

① 工具變量Z與混雜因素U無關聯;② 工具變量Z與暴露因素X有關聯;③ 工具變量Z與結局變量Y無關聯,Z只能通過變量X與Y發生關聯。

① 變量X與Y之間的關聯一定會受到潛在混雜因素U的影響,但工具變量Z與變量X以及Z與變量Y之間無潛在混雜因素影響;② 變量X與結局Y之間的關聯無法直接觀察獲得,因為無法直接測量變量X,但是Z是可測量的,並且Z與X直接的關聯是已知的或者可測量的,並獨立於其他因素而存在。(http://html.rhhz.net/zhlxbx/20170427.htm)

孟德爾隨機化是在非實驗數據中使用遺傳變異來估計暴露和結局之間的因果關系,也稱為“孟德爾解混雜”,它旨在給出因果關系的估計,不會因混雜因素而產生偏差。孟德爾隨機化的想法是找到與暴露有關的遺傳變異(或多個變異),但與影響結果的人和其他風險因素無關,並且與結果不直接相關。遺傳變異與結果之間的任何關聯都必須通過與暴露之間的關聯來進行,因此暗示了暴露對結果的因果關系,這樣的遺傳變異將滿足工具變量(IV)的假設

孟德爾隨機中,遺傳變異被作為工具變量評估暴露對結局的因果效應,遺傳變異滿足工具變量的基本條件總結為:
1)遺傳變異與暴露有關。
2)遺傳變異與暴露-結果關聯的任何混雜因素均不相關
3)改遺傳變異不會影響結果,除非可能通過化瘀暴露的關聯來實現。

盡管孟德爾隨機化分析通常涉及單個遺傳變異,但可以將多個變異用作單獨的IV或組合為單個IV。

暴露:指假定的因果風險因素,有時稱為中間表型,它可以是生物標志物(Biomarker)、人體測量指標(Physical measurement)或任何其他影響結果的風險因素(Risk factor)。通常,結局是疾病,但不局限於疾病。
非實驗數據涵蓋了所有觀察性研究,包括橫斷面和縱向,隊列研究和病例對照研究。

流行病學研究的基本目標是估計暴露對結局的影響
通常由於混雜因素,暴露與結果之間的觀察聯系有所不同,它們之間的相關性不能作為解釋因果關系的可靠證據。

MR設計策略:隨着統計學方法的深入不斷更新,一階段MR到單一樣本MR,兩樣本MR,兩階段MR,雙向MR以及基因-環境交互作用MR和網絡額MR。

兩樣本MR在全球大量GWAS合作組的公共數據中廣泛使用。兩樣本MR的設計策略是建立在G-X和G-Y的關聯研究人群來自相同人群的兩個獨立樣本(如GWAS與暴露,GWAS與結局的關聯數據),要求兩樣本具有相似的年齡、性別和種族分布特征,因為樣本量較大,該方法可以獲得更大的把握度。


代碼:# install package
if (!requireNamespace("MendelianRandomization"))
install.packages("MendelianRandomization")
library(MendelianRandomization)

IVWObject <- mr_ivw(MRInputObject,
model = "default",
robust = FALSE,
penalized = FALSE,
correl = FALSE,
weights = "simple",
psi = 0,
distribution = "normal",
alpha = 0.05)
IVWObject <- mr_ivw(mr_input(bx = ldlc, bxse = ldlcse,
by = chdlodds, byse = chdloddsse))
IVWObject

 

 

參考:
https://www.jianshu.com/p/354f9f0b9eed
http://html.rhhz.net/zhlxbx/20200813.htm


解釋變量explanatory variable也稱為可控制變量,即自變量。


隨機誤差項 random error term 也稱為隨機誤差,不包含在模型中的解釋變量或其他一些隨機因素對被解釋變量的總影響項。


工具變量 instrumental variable,簡稱“IV”,也稱為輔助變量,在無法實現可控實驗時,用於估計模型因果關系。在回歸模型中,當解釋變量與誤差項存在相關性,使用工具變量能得到一致的估計量。工具變量應該是不屬於原解釋方程且與內生解釋變量相關的變量。工具變量與所屬隨機解釋變量高度相關,與隨機誤差項不相關;與模型中其他解釋變量不相關;同一模型中需引入多個工具變量時,這些工具變量之間不相關。

弱工具變量:當遺傳變異與暴露因素不具有強相關關系,或者遺傳變異僅能解釋小部分的表型變異時,研究者稱之為“弱工具變量”。弱工具變量可導致統計學檢驗效能的降低,並且違背其他核心假設(例如遺傳變異的多效性)所產生的偏倚將可能被放大[12]。為降低弱工具變量導致的偏倚,可采取以下兩種策略:一是增加研究樣本量。工具變量與暴露因素的關聯強度通常使用回歸模型中的F統計量加以評估。根據經驗,工具變量的F統計量應>10[13]。由於F統計量受樣本量的影響,使用公開GWAS或者GWAS匯總數據以增加樣本量是減少弱工具變量偏倚的方法之一。二是增加表型解釋度。相比於單個遺傳變異,多個遺傳變異能夠解釋更大比例的表型變異。通過構建等位基因評分(也稱為遺傳風險評分)以綜合多個遺傳變異的效應,將其作為工具變量來預測危險因素的暴露水平,能夠增加工具變量所解釋的表型變異、降低弱工具變量偏倚。

本研究采用逆方差加權法(IVW)[23]作 為首要的因果效應估計。IVW 法是一種較為理想狀態 下的估計,是假設在所有遺傳變異都是有效工具變量的 基本前提下進行的有效分析,具有較強的因果關系檢測 能力。但是 IVW 法特別要求遺傳變異僅通過研究中的 暴露影響目標結局。盡管此研究已盡可能排除了已知 的混雜的 SNP,然而仍然有許多未知混雜因素會導致基 因多效性並對效應值的估計產生偏倚。因此,我們采用 了另外 4 種方法來檢驗結果的可靠性和穩定性,即 MR- Egger 回歸[24]、加權中位數法(WME)[25]、基於眾數的簡 單估計[26]、基於眾數的加權估計[26]。依次對每個代謝物 進行 MR 分析,如果以上五種不同的 MR 模型對因果效 應產生了相似的估計值,我們則認為該代謝物與冠心病 的因果關系是穩定且可靠的。(兩樣本孟德爾隨機化方法分析血液代謝物與冠心病的因果關系)

連鎖不平衡分析采用 PLINK(version 1.9)軟件;MR分析、基因多效性檢驗 以及敏感性分析采用 R 中的 TwoSampleMR 軟件包
(version 0.4.22)於Linux系統上進行分析。

基因多效性檢驗 MR 分析的假設之一是工具變 量只能通過暴露影響結局,若工具變量不通過影響暴露 而直接影響結局則違背了 MR 思想,所以需要檢驗暴露 與結局之間的因果推斷是否存在基因多效性。采用MR-Egger 回歸分析可以來評價基因多效性產生的偏 倚,其回歸截距可以評估多效性的大小,截距越接近於 0,則基因多效性的可能性越小

 

MR 可靠性評價:

1)敏感度分析:檢測並剔除非特異性的作為工具變量的SNPs

2)MR-Egger回歸分析:評價基因多效性帶來的偏倚,MR-Egger回歸直線的斜率可以估計定向多效性的大小。

 

MR研究的局限性:

1)難以發現合適的遺傳工具變量:基於GWAS的GRS(genetic risk scores,遺傳風險評分)並不很好,很難控制弱工具變量偏倚

2)把握度低:需要擴大樣本量才能獲得足夠的把握度,比如使用僅占1%效應的遺傳工具探討暴露和疾病之間的關聯,需要至少9500對以上的病例和對照樣本才能有80%的把握度獲得增加50%(OR=1.5)的生物學效應

3)Beavis效應:基於GWAS數據的MR研究可能會高估了遺傳和暴露之間的關聯,因為SNPs與混雜因素之間可能有潛在的關聯。

4)合理的生物學校解釋,盡管MR在因果推斷中發揮重要作用,但並不完善。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM