比較基因組分析


1. 基因家族聚類

基因家族是來源於同一個祖先,由一個基因通過基因重復和物種分歧而產生兩個或更多的拷貝而構成的一組基因,它們在結構和功能上具有明顯的相似性,編碼相似的蛋白質產物,同一家族基因可以緊密排列在一起,形成一個基因簇,但多數時候,它們是分散在同一染色體的不同位置,或者存在於不同的染色體上的,各自具有不同的表達調控模式。基因家族的鑒定,是進化分析很重要的一個方面; OrthoMCL(http://orthomcl.org/orthomcl/)流程是較常用的基因家族鑒定流程。

    Step1:對各個物種的基因集進行過濾。首先,一個基因存在多個可變剪接轉錄本時,僅留取編碼區最長的轉錄本用於進一步分析;其次,將編碼蛋白質小於50個氨基酸的基因排除。

    Step2:通過blastp比對獲得所有物種蛋白序列之間的相似性關系;e值為1e-5;再用solar連接斷開片段;

    Step3:使用OrthoMCL軟件對比對結果進行聚類,膨脹系數使用1.5;通過這個分析,可以得到單拷貝基因家族和多拷貝基因家族,它們在物種之間都是比較保守的;還可以得到物種特有的基因家族,它們可能與物種的特異性有關;

    Step4: 用muscle進行多序列比對,並對結果進行處理(一個位點上若只有一個物種含有鹼基,這種情況刪除這個位點),同時並進行格式轉化(每個物種為一行,物種名稱在前,序列在后的格式,每個物種鹼基位點一一對其)

    

通過這個分析,可以得到單拷貝基因家族和多拷貝基因家族,它們在物種之間都是比較保守的;還可以得到物種特有的基因家族,它們可能與物種的特異性有關;

 

2. 系統進化分析

在基因家族聚類的Step4中,利用單拷貝基因家族的序列,對各個家族進行MUSCLE (http://www.drive5.com/muscle/)比對,之后將比對結果合並,形成一個super alignment matrix,然后使用RAxML(http://sco.h-its.org/exelixis/web/software/raxml/index.html)軟件利用極大似然法(ML TREE)對所分析的物種進行系統發育樹的構建;

 

3. 物種分歧時間的估算

用單拷貝基因家族,使用PAML軟件包中的mcmctree (http://abacus.gene.ucl.ac.uk/software/paml.html)進行分歧時間估計,利用timetree網站,文獻中的分歧時間和r8s得到的時間校正點進行校正,TimeTree(http://www.timetree.org/)網站以及相關文章,mcmctree的運行參數為:burn-in=10,000,sample-number=100,000,sample-frequency=2;

3.1 運行r8s得到一部分矯正點

3.2 查閱相關文獻檢結合timetree和r8s的結果,使用mcmctree進行分歧時間的估算

 

4. 基因家族的擴張與收縮

根據基因家族的聚類分析結果,並過濾基因數在個別物種中存在異常的基因家族,使用CAFÉ(http://sourceforge.net/projects/cafehahnlab/)軟件進行基因家族擴張和收縮分析;進行擴張收縮分析之前,過濾掉在物種之前數目變化太大的基因家族,比如有一個基因家族的基因數目超過了200,此基因家族在所有的物種中數目小於2的

5. 正選擇分析

通過MUSCLE軟件對物種中的單拷貝基因家族的蛋白質序列進行多序列比對,比對結果通過Gblocks (http://molevol.cmima.csic.es/castresana/Gblocks.html)軟件進行過濾,去除低質量的比對區域,剩余比對結果作為模板生成對應的CDS多序列比對結果。對每個基因家族,使用PAML軟件包中的codeml工具,選擇枝位點特異模型(branch-site model)檢測秋茄基因家族是否受到正選擇。在PAML中,正選擇通過兩種假設的似然比檢驗來確定是否存在正選擇情況而非簡單的尋找ka/ks>1的基因。

 

6. 全基因組復制事件(WGD)

利用MCscan(http://chibba.agtec.uga.edu/duplication/mcscan/)軟件,分別搜索基因組內部及近緣物種基因組間的共線性區段,對該基因組內(間)共線性區段所包含的重復基因對進行序列比對,並計算4dTV值。4dTV可反映物種在進化史中是否發生全基因組復制事件、以及通過它與其它植物分化時間的比較區分發生全基因組復制相對時間的早晚,可判斷兩物種分化的時間,峰值為對應物種發生全基因組復制或分歧時間點。物種自身比較用的是旁系同源基因,物種與近緣物種的比較使用的是直系同源基因

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM