本周最新文獻速遞20210925


本周最新文獻速遞20210925

一、精細解讀文獻 一

文獻題目: Protein-coding repeat polymorphisms strongly shape diverse human phenotypes

不想看英文題目: 蛋白質編碼重復多態性強烈改變人類不同表型

雜志和影響因子: Science (IF: 47.73; Q1)

研究意義: 基因組中存在多個可變數目串聯重復序列 (VNTR),但是此類重復序列難以檢測,因此 VNTR 與大多數表型的關系尚不清楚。為此,作者開發了從全外顯子組測序數據檢測 VNTR 的方法。

VNTR 概念:包含多個變異位點的DNA重復序列,長度七至數千個鹼基,拷貝數在幾個到幾百之間,且拷貝數在個體間存在差異。
比如某個VNTR,個體1表現為:ATTCG|ATTCG|ATTCG;個體2表現為:ATTCG|ATTCG|ATTCG|ATTCG;

結論:

  • 作者開發了一種統計模型,可通過整合親緣關系、單倍型、鹼基特異性等信息估算 VNTR ;
  • 通過前面開發的方法將其應用在 UKBB 的 49,959 例全外顯測序數據中,隨后將 VNTR 上的變異位點映射在 415,280 例芯片數據樣本中,並與 786 個表型進行關聯分析,總共發現了 185 個顯著的關聯結果;
  • 為了證明前面發現的 185 個顯著關聯結果是由 VNTR 驅動的而非與 VNTR 連鎖不平衡的其他變異位點所驅動,作者使用 FINEMAP 對 VNTR 進行因果后驗概率計算,發現 5 個 VNTR(19 個關聯結果)的后驗概率超過0.95;
  • 5 個 VNTR 分別坐落在 TENT5A, MUC1, TCHH, ACAN 和 LPA 基因上。其中,TENT5A, MUC1, TCHH 與表型的關聯之前未被報道過,LPA 上的重復序列 KIV-2 與脂蛋白的相關性之前已有文獻報道:LPA 上的重復序列 KIV-2 在12-24個拷貝數時,每減少一個拷貝數,脂蛋白濃度增加37%;
  • 有文獻報道血清脂蛋白水平在群體間存在差異(B圖),作者發現這一差異是由重復序列 KIV-2 上的變異位點頻率差異引起的(C圖);
  • 另一個例子是 TCHH 上的 VNTR, 被發現與毛發表型相關。與此同時, VNTR 區域上的 rs11803731 也與毛發表型相關,分別對 VNTR 和 rs11803731 進行條件分析,發現 VNTR 和 rs11803731 各自獨立影響毛發表型;

GWAS條件分析(conditional analysis)教程:https://www.cnblogs.com/chenwenyan/p/10278893.html

亮點: 開發了從全外顯測序數據種檢測 VNTR 的方法;

局限: 49,959 例全外顯測序數據、415,280 例芯片數據、786 個表型,這么大體量只檢測到 185 個顯著的結果,可見這個方法的應用局限性很大。對於大多數少樣本少表型的研究隊列來說,采用該方法很難檢測到有意義的結果;

文章鏈接:

公開的資料:

二、精細解讀文獻 二

文獻題目: Differentially expressed genes reflect disease-induced rather than disease-causing changes in the transcriptome

不想看英文題目: 疾病使得基因產生差異表達,而非差異表達引起疾病發生(論轉錄組與疾病之間的因果關系:疾病是因,基因差異表達是果)

雜志和影響因子: Nat Commun (IF: 12.121; Q1)

研究意義: 通過轉錄組可檢測健康個體和患病個體之間的差異表達基因,但差異表達基因與疾病之間的相關性未必反映二者的因果性。作者開發了一種方法,可區分差異表達基因與表型之間的相關性是正向、反向因果關系還是由混淆因素引起的;

結論:

  • 有別於之前的基因表達對表型的因果性檢測方法(轉錄組孟德爾隨機化方法,TWMR),作者開發了一種方法(逆轉錄組孟德爾隨機化方法,revTWMR),可檢測表型對基因表達是否產生影響;

  • 將 revTWMR 方法應用在 19,942 個基因和 12 種復雜表型上,包括 BMI、克羅恩病(CD)、教育程度(EDU)、空腹血糖(FG)、高密度脂蛋白(HDL)、 身高、低密度脂蛋白(LDL)、類風濕性關節炎(RA)、精神分裂症(SCZ)、總膽固醇(TC)、甘油三酯(TG)和根據BMI調整的腰臀比(WHRadjBMI),發現 46 個基因的表達被一種及以上的表型所影響 (PrevTWMR < 2.5 × 10-6 = 0.05/19,942);
  • 最顯著的結果是甘油三酯(TG)和類風濕性關節炎(RA),分別影響 26 和 15 個基因的表達;
  • 為了證明 revTWMR 可有效檢測表型和基因的因果性,作者使用 MR-PRESSO 檢測水平多效性,發現16對顯著的"表型→基因"存在水平多效性,移除了具有水平多效性的工具變量后(SNP),9對"表型→基因"仍然存在因果關系;

為什么要檢驗水平多效性

孟德爾隨機化分析有三個假設,其中的一個假設就是工具變量(一般是遺傳位點)必須通過暴露因素(exposure,大胸)影響結果(outcome,不愛運動)。

如果工具變量可以不通過暴露因素直接影響結果,那么就違反了孟德爾隨機化的思想,即檢驗結果存在水平多效性。

上面一段話是不是很拗口,用直白的話說,就是假定SNP位點rs123同時與大胸顯著相關(暴露因素),又同時與不愛運動顯著相關(結局變量),那么我們就認為用rs123進行大胸和不愛運動的因果關系推斷是存在水平多效性的,檢驗結果即便是顯著,他們之間的因果關系也不成立

所以,用孟德爾隨機化進行因果關系推斷的大前提是沒有水平多效性

教程:使用MR-PRESSO檢驗水平基因多效性(孟德爾隨機化分析) https://www.cnblogs.com/chenwenyan/p/13283551.html

  • 隨后對顯著的"表型→基因"對進行疾病的相關性分析,並與遺傳相關性的結果進行比較,發現"表型→基因"對的計算結果和遺傳相關性的計算結果高度一致 (r = 0.84),說明 revTWMR 方法檢測到的基因可有效反映不同疾病背后共享的遺傳效應;

  • 為了更好理解 revTWMR 檢測到的顯著基因背后所代表的生物學意義,作者分別對差異表達基因和 TWMR 方法以及 revTWMR 方法檢測到的顯著基因進行比較,結果發現 revTWMR 檢測到的基因與差異表達基因顯著相關,而 TWMR 檢測到的基因與差異表達基因無顯著相關,說明常規的 RNA-seq 分析發現的差異表達基因很多是受疾病影響才產生的( revTWMR 思想:疾病是因,基因差異表達是果),而非差異表達基因引起疾病的產生( TWMR 思想:基因差異表達是因,疾病是果);

  • 利用DrugBank和STITCH檢測 revTWMR 發現的"表型→基因"能否作為潛在的葯物治療靶標,結果發現 revTWMR 檢測到的基因可作為疾病早期標志物以及治療靶標,以高密度脂蛋白膽固醇為例,revTWMR 檢測到高密度脂蛋白膽固醇可引起8個基因的表達發生變化,在這8個基因中,有4個基因與高密度脂蛋白膽固醇的靶向葯物相互作用(阿托伐他汀、洛伐他汀、普伐他汀和辛伐他汀);
  • 作者隨后在小鼠模型中證明 revTWMR 方法的有效性, 以 TG 表型為例, revTWMR 發現 TG 影響了 26 個基因的表達,利用此信息在小鼠模型中用高脂肪飲食 (HFD)進行誘導並檢測差異表達基因。結果發現 revTWMR 檢測到的基因在差異表達基因中顯著富集,而TWMR檢測到的基因並無顯著富集,再一次說明了很多差異表達基因是受疾病影響才產生的( revTWMR 思想:疾病是因,基因差異表達是果),而非差異表達基因引起疾病的產生( TWMR 思想:基因差異表達是因,疾病是果);

亮點: 提出了一種驗證疾病對基因表達水平影響的方法;

局限: 所有孟德爾隨機化方法存在的局限,此文均也存在;

號外,我沒想明白為什么基因表達對疾病的因果關系用cis-eQTLs,而疾病對基因表達的因果關系用trans-eQTLs,明白的老師同學們歡迎指教一下 😄

文章鏈接:

https://www.nature.com/articles/s41467-021-25805-y

公開的資料:


三、其他文獻推薦

下面的文獻也挺精彩的,但由於下不到原文,或博主時間有限,沒法精細解讀,故列出來供各位參閱;
當然,你們有精彩的文獻想讓我解讀的(前提是一周內剛出爐的文獻),可給我發pdf(然而可能種種原因,我不一定有時間解讀,不要對我抱太高期待);


文獻題目: Proteogenomic characterization of pancreatic ductal adenocarcinoma

不想看英文題目: 胰腺導管腺癌的蛋白質組學特征

雜志和影響因子: Cell (IF: 38.637; Q1)

文章鏈接:

https://www.cell.com/cell/fulltext/S0092-8674(21)00997-1


文獻題目: Investigating the shared genetic architecture between multiple sclerosis and inflammatory bowel diseases

不想看英文題目: 多發性硬化症和炎症性腸病之間的共同遺傳結構研究

雜志和影響因子: Nat Commun (IF: 12.121; Q1)

文章鏈接:

https://www.nature.com/articles/s41467-021-25768-0


文獻題目: A longitudinal sampling study of transcriptomic and epigenetic profiles in patients with thrombocytopenia syndrome

不想看英文題目: 血小板減少綜合征患者的轉錄組和表觀遺傳組的縱向抽樣研究

雜志和影響因子: Nat Commun (IF: 12.121; Q1)

文章鏈接:

https://www.nature.com/articles/s41467-021-25804-z


文獻題目: Polygenic Risk Scores for Kidney Function and Their Associations with Circulating Proteome, and Incident Kidney Diseases

不想看英文題目: 腎臟功能的多基因風險評分與循環蛋白質組和腎臟疾病的關聯

雜志和影響因子: J Am Soc Nephrol (IF: 10.12; Q1)

文章鏈接:

https://pubmed.ncbi.nlm.nih.gov/34548389/


四、工具或資源類介紹


文獻題目: Enhancing discoveries of molecular QTL studies with small sample size using summary statistic imputation

不想看英文題目: 如何在小樣本量的情況下增加 QTL 的檢測數量

雜志和影響因子: Brief Bioinform (IF: 11.62; Q1)

文章鏈接:

https://pubmed.ncbi.nlm.nih.gov/34545927/


文獻題目: COVID19db: a comprehensive database platform to discover potential drugs and targets of COVID-19 at whole transcriptomic scale

不想看英文題目: COVID19db:在轉錄組范圍內發現 COVID-19 潛在葯物和靶點的數據庫

雜志和影響因子: Nucleic Acids Res (IF: 11.501; Q1)

文章鏈接:

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab850/6374481


文獻題目: Animal-eRNAdb: a comprehensive animal enhancer RNA database

不想看英文題目: Animal-eRNAdb: 動物增強子RNA數據庫

雜志和影響因子: Nucleic Acids Res (IF: 11.501; Q1)

文章鏈接:

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab832/6374163


文獻題目: PlantGSAD: a comprehensive gene set annotation database for plant species

不想看英文題目: PlantGSAD: 植物的基因集注釋數據庫

雜志和影響因子: Nucleic Acids Res (IF: 11.501; Q1)

文章鏈接:

https://doi.org/10.1093/nar/gkab794


文獻題目: timeOmics: an R package for longitudinal multi-omics data integration

不想看英文題目: timeOmics:用於縱向多組學數據集成的 R 包

  • 該 R 包可識別與時間密切相關的分子特征

雜志和影響因子: Bioinformatics (IF: 5.61; Q1)

文章鏈接:

https://doi.org/10.1093/bioinformatics/btab664


文獻題目: CIndex: Compressed indexes for fast retrieval of FASTQ files

不想看英文題目: CIndex:快速索引以及高效壓縮 FASTQ 文件的工具

雜志和影響因子: Bioinformatics (IF: 5.61; Q1)

文章鏈接:

https://doi.org/10.1093/bioinformatics/btab655


致謝橙子牛奶糖(陳文燕),請用參考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX

感謝小可愛們多年來的陪伴, 我與你們一起成長~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM