比較基因組學中-利用單拷貝基因構建進化樹


(1)同源基因的查找

  OrthoMCL or Orthofinder;

(2)多序列比對

  Muscle / MAFFT / ClustalW / T-coffee, Muscle 效果好點

(3)調取保守區域,並收尾連接,形成supergene

  Gblocks  

(4)進化樹構建

  RaxML MEGA 等,  很多文獻用RaxML,PhyML或Mrbayes,因為ML樹和貝葉斯進化樹對核苷酸 / 氨基酸替代模型的選擇非常敏感,故在進行進化樹或分化時間構建之前,需對核苷酸 / 氨基酸替代模型進行選擇。(jModelTest 對cDNA進行替代模型選擇,ProtTest 對蛋白進行替代模型選擇

  構建樹的教程:https://www.yuque.com/wusheng/gw7a9p/mcc73y

(5)分化時間分析 divergence time

  mcmctree. PAML中的一個程序, BEAST2

(6)基因擴張收縮分析

  CAFE  

(7)基因是否收到正選擇

  codeML PAML中一個程序

  

 

 

 

 

https://zhuanlan.zhihu.com/p/39992256

一、為什么需要選擇核苷酸替換模型

構建進化樹可以通過同源 DNA序列或蛋白質分子的氨基酸序列來實現,其具體的步驟基本上是先選取生物數據(同源 DNA 序列或蛋白質分子的氨基酸序列數據)與進化距離模型,然后對不同物種DNA 或蛋白質的序列進行比對,再應用距離模型和比對結果計算進化距離,最后通過進化距離構建進化樹。

因此,選擇進化距離模型是構建進化樹的基礎,DNA分子中基因的進化距離是通過對核苷酸替代數進行估計獲得的(當遺傳信息從父代復制到子代時,往往會發生一些改變,這些改變稱為突變。突變是DNA進化的動力。常見的突變模式有:替代,即一個核苷酸被另一個核苷酸所替代;插入,即插入一個或多個核苷酸;刪除,即刪除一個或多個核苷酸。但是在分析進化時,一般只考慮替代。),要估計核苷酸替代數,就必須應用核苷酸替代的數學模型。由於核苷酸替換模型的選擇直接影響進化距離的計算,進而對所構建的系統樹是否合理起決定作用。即本文中核苷酸替換模型選擇的問題?

二、核苷酸替換模型的選擇

選擇模型涉及兩個主要問題,一是采用什么標准判斷模型與數據擬合好壞的問題,二是采用什么方法計算選擇模型的目標函數。對於第一個問題,目前提出的方法有似然率檢驗、AIC信息標准(information criteria)、貝葉斯因子(BIC標准)和決策論法等。對於第二個問題,目前主要采用最大似然法和貝葉斯法兩種方法計算模型在給定數據集和系統樹上的似然值。

有了核苷酸替代模型,我們就可以計算進化距離。在同一替代模型中,對核苷酸替代速率做不同假設就會得到不同的進化距離(不同的進化距離構建得到不同的進化樹),常用的進化距離包括: p距離、替代率為常數的d 距離、替代數服從 [公式] 分布的 [公式] 距離 [公式] 。最后就可以通過進化距離構建系統樹。目前比較常用的替代模型包括:JC69模型、K80模型、F81模型、TN93模型。由於核苷酸替換模型的選擇直接影響進化距離的計算,進而對所構建的系統樹是否合理起決定作用。以上內容摘自郭子湖的碩士畢業論文,主要方便學習查閱,侵刪致歉。

  

https://www.biomart.cn/65423/news/2908793.htm 

參考這個


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM