序列相似性比較與同源性分析


首先應該注意區分序列相似性與序列同源性的關系,序列相似不一定同源,但是判定同源性關系的時候有些算法(Maximum likelihood除外)要考慮到序列相似性。序列相似性是將待研究序列與DNA或蛋白質序列庫進行比較,用於確定該序列的生物屬性,也就是找出與此序列相似的已知序列是什么,完成這一工作只需要用到兩兩序列比較算法,常用的程序包有BLAST,FASTA等。同源性分析是將待研究序列加入到一組與之同源,但是來自不同物種的序列中進行多序列比對,以確定該序列與其它序列間的同源性大小。多序列比較算法常用的程序包有CLUSTAL等。

1、  序列比對,從數據庫中尋找相似序列: 首先打開NCBI的BLAST網站:https://blast.ncbi.nlm.nih.gov/Blast.cgi ,選擇protein blast,然后將待比對序列粘貼進去,進行BLAST(一些參數的設置收藏夾或百度)。等待一定時間后將會出現與所選數據庫的比對結果,按照打分高低將top100(可以設置成其他數值)的序列顯示出來,然后可以將該100條序列下載下來。存成test.fasta文件。這個文件就是在mega中進行多序列比對建樹所用的文件。

2、  多序列比對:打開mega,ALIGN-BUILDALIGNMENT-Create a new alignment-protein-open-retrieve sequences from file-no -test.fasta(或者直接拖動進去,或者雙擊打開test.fasta),然后點擊Alignment——Align by ClustalW——OK——OK。然后比對成功,選擇Data——Export Alignment——MEGA format保存文件為test.meg,可以關閉Align會話框。

3、  構建進化樹:打開test.meg。點擊PHYLOGENY——選擇最上面的ML方法,參數可以選擇默認參數。就出現了進化樹。當然一些參數最好還是用到,比如說可信度驗證的次數設置最好要大於等於500次。

4、  進化樹的美化與理解

http://www.360doc.com/content/14/0617/22/17553313_387599563.shtml

https://www.sohu.com/a/196872269_675868

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM