16s 數據庫


一、Greengenes數據庫

Greengenes數據庫由Lawrence Berkeley National Laboratory構建。最新版本為13.8,它對13.5的序列分類進行了修正,13.5版本總共收錄16S rRNA序列1,262,986條。這是非冗余的序列,Greengenes可以用Export工具實現對數據的過濾,輸出定制的數據庫。qiime軟件中默認使用的是greengene數據庫,為97_otus.fasta這個文件,以及一個對應的注釋文件97_otu_taxonomy.txt,一個構建好的系統發育樹97_otus.tree。里面包含了99322條非冗余的16S序列。目前最新的文件為99_otus.fasta。Greengenes提供比對工具NAST,可進行多序列比對。提供在線trim處理,可以根據質量值修剪FASTA格式數據文件。qiime中可以使用pynast軟件來進行比對,此外,網站的probe工具提供16S rRNA區域探針或者引物的設計功能。GreenGene只包含16S/18S序列,不包含大亞基23S/28S序列。

網站鏈接:http://greengenes.secondgenome.com/

ftp://greengenes.microbio.me/greengenes_release/

http://greengenes.secondgenome.com/downloads/database/13_5

二、SILVA數據庫

SILVA數據庫由德國馬普研究所和Ribocon主持,提供最新的核糖體大小亞基rRNA注釋信息。SILVA數據庫是軟件包ARB的官方數據庫,提供全面的,高質量的可比對的小亞基(如16S/18S,SSU),以及大亞基(23S/28S,LSU)的rRNA序列,用於細菌,古生菌,以及真菌分析。silva也是mothur軟件中推薦使用的數據庫,截止到本課程制作時間的版本是Version 126,不過126版本目前只提供網絡應用,能夠下載使用的為123版本。silva數據庫提供超過170多萬個SSU,9萬多LSU序列。silva數據庫里面包含五個獨立的部分,分別是小亞基的SSU Parc,SSU Ref 以及 SSU Ref NR ,還有大亞基的LSU Parc 與LSU Ref。這些庫之間有什么差別呢。這是根據不同的序列長度以及聚類的序列相似性來生成的。官網上面有詳細的介紹。我們可以通過網頁或者ftp服務器下載silva的數據庫。里面包括arb文件和fasta文件,如果不使用arb的軟件,我們只需下載fasta的文件。ARB_files存儲的為arb格式的文件,Export為fasta序列格式的文件。在16S序列分析中,我們推薦使用SSU Ref NR這個數據庫,這個是使用99%的identity標准來進行非冗余處理,准確性更高,在18S序列分析中,使用LSU Ref。並且這些版本的數據庫包含一個Guide Tree。

 

網站鏈接:http://www.arb-silva.de/


三、RDP數據庫
RDP數據庫來自於(Ribosomal Database Project),前面課程我們提到過RDP的分析流程。其中數據庫提供核糖體相關數據和服務,包括在線的數據分析、比對、16S rRNA序列的注釋。RDP最新版本是Release 11.4,發布於2015.5.26,收錄了共3,224,600條16S rRNAs序列,108,901條真菌28S rRNA序列,是使用最廣的16S rRNA序列數據庫。RDP數據庫提供16S rRNA序列比對和分類、進化樹構建、物種分類heatmap、功能基因分析等方便的數據處理功能。RDP項目提供了完整的16S和18S分析方案,

網站鏈接:http://rdp.cme.msu.edu/index.jsp


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM