本周最新文獻速遞20211031


本周最新文獻速遞20211031

一、精細解讀文獻 一

文獻題目: An open approach to systematically prioritize causal variants and genes at all published human GWAS trait-associated loci

不想看英文題目: 在所有已發表的人類 GWAS 性狀相關位點上系統性優先排序因果變異位點和基因

雜志和影響因子: Nat Genet (IF: 38.33; Q1)

研究意義: 全基因組關聯研究 (GWAS) 發現了許多與復雜性狀相關的變異位點,但確定因果基因仍是一項重大挑戰。本研究提供了一個開放性資源,可在 133,441 個已發表的人類 GWAS 基因座中提供系統的精細定位和基因優先排序結果。

結論:

  • 作者從 GWAS Catalog 和 the UK Biobank 總共收集了 3,621 個 GWAS 數據集,133,441 個表型相關位點;

  • 133,441 個表型相關位點中,53% 的位點在一種以上的表型間共享;
  • 對 133,441 個表型相關位點構建 95% 置信度數據集, 12,500 (9%) 的 95% 置信度數據集只有一個因果位點,21,279 (16%) 的 95% 置信度數據集有 2-5 個因果位點。因果變異位點數量越少的 95% 置信度數據集,通常頻率也越低;

  • VEP注釋結果表明,與擁有多個變異位點的 95% 置信度數據集相比,只有單個變異位點的 95% 置信度數據集,變異位點對轉錄本的影響更大 (odds ratio (OR) = 8.51, P < 2.2 × 10 -16 , Fisher’s exact test);
  • 保留 95% 置信度數據集中具有中/高影響的 2,284 個編碼變異位點(VEP注釋),與之相關的編碼基因和表型有 378 和 303 個。其中有幾個疾病相關的編碼基因已被批准為治療靶點,以 PHLDA3 上的 rs35383942 位點為例, rs35383942 為乳腺癌相關的位點,_PHLDA3_是 TP53 的直接靶標;
  • 保留 95% 置信度數據集中具有中/高影響的 2,284 個編碼變異位點(VEP注釋),與之相關的編碼基因和表型有 378 和 303 個。其中有幾個疾病相關的編碼基因已被批准為葯物治療靶點,以 PHLDA3 上的 rs35383942 位點為例, rs35383942 與乳腺癌相關,而 PHLDA3 被報道為 TP53 的直接靶標,其通過抑制 AKT1 產生抗腫瘤作用;
  • 對 70,364 個基因座與表達相關變異位點(eQTL)、蛋白質水平相關變異位點(pQTL)進行共定位, 發現 49.4% 的基因座沒有共定位基因( H4 >0.8),25.5% 有一個共定位基因,25.2% 超過一個共定位基因;
  • 對 3,621 個 GWAS 數據集進行了跨性狀共定位,以識別潛在的受相同分子調控的性狀,跨性狀共定位揭示 6 號染色體上的一個基因座與哮喘 (6_90220794_T_C) 和克羅恩病 (6_90263440_C_A) 共定位,表明這兩種疾病可能在該基因座具有相同的遺傳風險;
  • 隨后作者將精細定位與功能基因組學特征相結合,開發了“基因座-基因”( locus to gene,L2G)模型。在該模型中手動納入 445 個基因作為金標准(GSP),利用多個功能基因組學特征(比如葯物靶點-疾病信息、共定位表觀遺傳標記、報告基因檢測等)進行訓練,通過預測 445 個基因是否為因果基因評估模型的表現性能。利用 L2G 模型對所有 GWAS 中的因果基因進行優先排序,發現 L2G 模型鑒定的因果基因被大多數文獻支持且富集了更多的葯物靶點;

  • 最后,作者將所有的結果整合在 Open Targets Genetics 網站中;

亮點:

  • 開發了 L2G 模型,提高因果基因的檢測性能;
  • 開發了 Open Targets Genetics 網站,收錄了歐洲和非歐洲的多個 GWAS 數據集以及 92 個組織/細胞類型特定 molQTL 匯總統計數據共定位結果;

文章鏈接:

https://www.nature.com/articles/s41588-021-00945-5

公開的資料:

二、精細解讀文獻 二

文獻題目: Validation of lipid-related therapeutic targets for coronary heart disease prevention using human genetics

不想看英文題目: 使用人類遺傳學驗證預防冠心病的靶點

雜志和影響因子: Nat Commun (IF: 14.92; Q1)

研究意義: 全基因組生物標志物的孟德爾隨機化 (MR) 已證實低密度脂蛋白膽固醇(LDL-C)增加冠心病(CHD)風險,然而高密度脂蛋白膽固醇 (HDL-C) 和甘油三酯 (TG)對冠心病的作用仍較為模糊;

結論:

  • 通過全基因組生物標志物 MR 研究,在發現集中發現 LDL-C 和 TG 提高 CHD 的風險(OR CI 分別為 1.39–1.63 和 1.01–1.21),HDL 對 CHD 風險的 OR CI 為 0.90–1.01,在驗證集中同樣證明 LDL-C 和 TG 可提高 CHD 的風險(OR CI 分別為 1.25-1.31 和 1.14-1.32),然而 HDL 對 CHD 風險的 OR CI 為0.83–0.96,可見在單變量 MR 分析中, HDL 對 CHD 的貢獻在不同的研究中是存在差異的;
  • 為了評估三種脂質成分對 CHD 的獨立貢獻,作者在發現集中進行了多變量 MR 分析 (MVMR), 發現 LDL-C、HDL-C 和 TG 對 CHD 風險的 OR CI 分別為 (1.44-1.62、0.86-0.95、1.01–1.17);
  • 隨后對葯物靶點進行 MR 分析,以確定對 CHD 具有影響的蛋白質。在 P  < 1 × 10−6 的閾值下,發現了 341 個編碼葯物蛋白的基因,149 個基因與 LDL-C 相關,180 個與 HDL-C 相關,154 個與 TG 相關。在 341 個基因中,141(41%) 的基因只與一種脂質相關,101 個(30%) 的基因與兩種脂質相關,100 (29%) 的基因與所有脂質相關;
  • 在 341 個葯物靶點中,165 個與 CHD 相關,其中 131 個葯物靶點在LDL-C/TG /HDL-C 中保護作用一致;

  • 葯物靶點 MR 分析還發現了 40 個葯物靶點被報道與脂質不良反應事件相關、另外五個基因 (PCSK9, PPARG, PPARA, NPC1L1, 和 HMGCR) 參與脂質修飾,其中 NPC1L1, HMGCR 和 PCSK9 可用於 CHD 預防;
  • 為了驗證 MR 結果,作者使用了 UKBB 進行驗證,驗證集發現了 47 個顯着的 MR 結果(P值 < 0.05),其中 39/47(83%)與發現集的方向一致;

  • 為了識別潛在的脂質介導途徑,作者進行了多變量葯物靶標 MR 分析(MVMR) ,結果發現 12 個葯物靶標 (SLC12A3, APOB, APOA1, PVRL2, APOE, APOC1, CELSR2, GPR61, PCSK9, 和 CEACAM16)通過 LDL-C 影響 CHD, LPL 通過 HDL-C 影響 CHD,ALDH1A2 通過 TG 影響 CHD。另外SMARCA4 和 APOA5 通過 LDL-C 和 TG 共同影響 CHD, 而RPL7A 通過 LDL-C 和 HDL-C 共同影響 CHD;
  • 對脂質和 CHD 進行共定位,發現 33 個基因座共定位,其中25 個共定位基因為葯物蛋白基因;
  • 為了研究葯物靶基因是否在肝臟中特異性表達(肝臟為脂質代謝靶向組織),作者提取了人類蛋白質圖譜的 RNAseq 數據,結果發現與其他組織相比,葯物靶基因在肝臟中特異性表達;
  • 為了探索葯物靶基因對 CHD 潛在的其他影響,作者進行了全表型關聯分析(Phenome-wide scan),發現六個葯物靶基因(NDUFA13、CILP2、PVRL2、VEGFA、APOC1 和 LPL)與 2 型糖尿病相關、五個(APOC1, PVR, PVRL2, APOE 和 CEACAM16)與阿爾茨海默病相關、四個(SMARCA4、CETP、VEGFA 和 ALDH1A2)與哮喘相關,四個(APOA1、APOC3、APOA4 和 APOA5)與痛風相關;

亮點: 將 GWAS 結果與葯物靶標結合起來是這些年一直呼吁的方向,本文就是很好的一項例子,值得學習;

文章鏈接:

https://www.nature.com/articles/s41467-021-25731-z

公開的資料:


三、其他文獻推薦

下面的文獻也挺精彩的,但由於下不到原文,或博主時間有限,沒法精細解讀,故列出來供各位參閱;
當然,你們有精彩的文獻想讓我解讀的(前提是一周內剛出爐的文獻),可給我發pdf(然而可能種種原因,我不一定有時間解讀,不要對我抱太高期待);


文獻題目: Single-cell nuclear architecture across cell types in the mouse brain

不想看英文題目: 小鼠大腦細胞類型的單細胞核結構

雜志和影響因子: Science (IF: 41.845; Q1)

文章鏈接:

https://www.science.org/doi/10.1126/science.abj1966


文獻題目: Exome sequencing and analysis of 454,787 UK Biobank participants

不想看英文題目: 454,787 名英國生物銀行參與者的外顯子組測序分析

雜志和影響因子: Nat Genet (IF: 38.33; Q1)

文章鏈接:

https://www.nature.com/articles/s41586-021-04103-z


文獻題目: Mutational signatures in esophageal squamous cell carcinoma from eight countries with varying incidence

不想看英文題目: 八個不同發病率國家的食管鱗狀細胞癌的突變特征

雜志和影響因子: Nat Genet (IF: 38.33; Q1)

文章鏈接:

https://www.nature.com/articles/s41588-021-00928-6


文獻題目: Genome-wide association study identifies susceptibility loci for acute myeloid leukemia

不想看英文題目: 全基因組關聯分析鑒定急性髓系白血病易感位點

雜志和影響因子: Nat Commun (IF: 14.92; Q1)

文章鏈接:

https://www.nature.com/articles/s41467-021-26551-x


文獻題目: Asthma-associated genetic variants induce IL33 differential expression through an enhancer-blocking regulatory region

不想看英文題目: 哮喘相關變異位點通過增強子阻斷誘導 IL33 差異表達

雜志和影響因子: Nat Commun (IF: 14.92; Q1)

文章鏈接:

https://www.nature.com/articles/s41467-021-26347-z


四、工具或資源類介紹


文獻題目: The National Microbiome Data Collaborative Data Portal: an integrated multi-omics microbiome data resource

不想看英文題目: 集成的多組學微生物組數據庫

雜志和影響因子: Nucleic Acids Res (IF: 16.97; Q1)

文章鏈接:

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab990/6414581


文獻題目: BrainBase: a curated knowledgebase for brain diseases

不想看英文題目: BrainBase:腦部疾病數據庫

雜志和影響因子: Nucleic Acids Res (IF: 16.97; Q1)

文章鏈接:

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab987/6414573


文獻題目: TcoFBase: a comprehensive database for decoding the regulatory transcription co-factors in human and mouse

不想看英文題目: TcoFBase:人類和小鼠轉錄輔因子數據庫

轉錄輔因子 (transcription co-factors, TcoFs),包括轉錄激酶、表觀遺傳蛋白和共激活因子等, 連接增強子和啟動子,參與轉錄調控,在基因表達調控中發揮着至關重要的作用。

雜志和影響因子: Nucleic Acids Res (IF: 16.97; Q1)

文章鏈接:

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab950/6414596


文獻題目: EWAS Open Platform: integrated data, knowledge and toolkit for epigenome-wide association study

不想看英文題目: EWAS 開放平台:用於全表觀基因組關聯分析的集成數據、知識和工具包

雜志和影響因子: Nucleic Acids Res (IF: 16.97; Q1)

文章鏈接:

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab972/6414594


文獻題目: EDCNN: Identification of Genome-Wide RNA-binding Proteins Using Evolutionary Deep Convolutional Neural Network

不想看英文題目: EDCNN:使用卷積神經網絡識別全基因組 RNA 結合蛋白

雜志和影響因子: Bioinformatics (IF: 5.61; Q1)

文章鏈接:

https://doi.org/10.1093/bioinformatics/btab739


致謝橙子牛奶糖(陳文燕),請用參考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX

感謝小可愛們多年來的陪伴, 我與你們一起成長~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM