FunGene 功能基因數據庫


背景:16SrRNA 基因通常作為分子標記進行微生物群落結構的研究,但是它有一些明顯的限制,比如16S rRNA基因在物種中會有多個拷貝,而且,由於16S rRNA基因的進化速率較慢,在物種間保守,會存在多個物種的基因完全相同的情況,而且由於基因水平轉移的發生,即使親緣關系較遠的物種,也可能出現基因序列完全相同的情況,更進一步講,我們分析時通常只采用16S rRNA基因的某些區域,這導致物種間擴增出來的片段完全相同的概率大大增加;而一些蛋白編碼基因,特別是一些參與重要的信號通路的基因,比如參與氮循環的的基因,這些基因出現水平轉移的概率小,也可以作為分子標記來研究微生物的群落結構。FunGene 是一個免費的數據庫,收錄了許多功能基因的序列,而且提供了一些工具對功能基因進行分析。

網址:

    http://fungene.cme.msu.edu/

 

FunGene 將功能基因進行了分類,共分為下面7類:

以功能基因 nifh 為例,下載數據庫中對應的蛋白質序列

點擊對應的鏈接

跳轉的界面如下:

從上面的截圖可以看到,數據庫中收錄的序列是有重復的,其實FunGene的序列來源於GeneBank 數據庫,而GeneBank 數據庫是有冗余的,所以FunGene 也會有冗余現象,所以在下載完序列之后,需要去冗余

在去冗余的過程中需要注意,uncultured 代表無法單獨培養的一些菌, 比如 uncultured bacterium 代表無法單獨培養的細菌,這個是一類物種的簡稱,不是指同一個物種;

在實際的下載過程中,我發現,FunGene 一次只允許下載10000條序列。

參考資料:

    http://journal.frontiersin.org/article/10.3389/fmicb.2013.00291/full

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM