PHI 數據庫簡介


PHI是一個致病菌的數據庫,截止到2017年8月1號為止,最新的版本是4.3,數據庫中收錄了實驗驗證過的致病菌的信息,其中有176個來自動物的致病菌,227個來自植物的致病菌,3個來自真菌的致病菌;

4.3版本中數據庫的具體信息如下:

共收錄了4775個基因, 相互作用有8610條, 致病菌有264種, 宿主有173種,疾病有428種,References 參考文獻有2330種

數據庫網址如下:

http://www.phi-base.org/index.jsp

在數據庫的記錄中,包含以下幾個比較常用的字段的信息:

 GENE NAME                   : 基因名稱

HOSE SPECIES               : 宿主的物種名稱

PATHOGEN SPECIES       : 致病菌的名稱

DISEASE NAME              : 疾病名稱

PHI-BASE ACCESSIONID : phi-base 數據庫的編號

PHENOTYPE  MUTANT    : 致病菌導致的表型變化

EXPERIMENTAL EVIDENCE : 實驗證據

MULTIPLE MUTATION          : 

以基因 AcpC 為例,進行檢索

在輸入框中輸入基因名稱,點擊SEARCH 按鈕,檢索出來的結果如下:

圖片左側的輸入框提供了不同的篩選項,可以根據Year等因素對結果進行進一步篩選,右側的表格是檢索出的最終結果

 phi-base 是可以免費下載的,首先需要注冊一個賬號,點擊Download 按鈕會提示注冊賬號,注冊的過程就不詳細寫了,注冊完成之后就可以看到下載鏈接:

phi-base 提供了兩種下載方式:

第一種:下載fasta格式的序列,可以方便的用構建本地版的blast數據庫,對基因進行功能注釋

第二種:csv格式的整個數據庫,這種下載方式得到的信息更加全面

下載到的fasta部分內容如下:

>A0A023H5D8#PHI:6442#EepR#615#Serratia_marcescens#reduced_virulence
MDNNHQKFDSQSIANRVRELFLHYGIGKRQHARELSRILDLSFSHAHRKLKGQSPWTLEQINSVAAALGETPAAIADLSAEHETTEPNMARDAIFFVAGVAMPCVGHIGDELPAGRPAEFVALRVEGQWHIYRADEAPAGPRYGV
>A0A023NA98#PHI:3354#rtxA1#672#Vibrio_vulnificus#reduced_virulence
MGKPFWRSVEYFFTGNYSADDGNNSIVAIGFGGEIHAYGGDDHVTVGSIGAKVYTGSGNDTVVGGSAYLRVEDTTGHLSVKGAAGYADINKSGDGNVSFAGAAGGVSIDHLGNHGDVNYGGAAAYNGITRKGLSGNVTFKGAGGY

 

 可以看到為蛋白質序列,可以通過blastp對基因進行致病性的功能注釋

csv格式如下:

csv文件為整個數據庫的所有記錄,包含的字段很多,比較重要的還是之前的幾個字段;

參考資料 : https://www.ncbi.nlm.nih.gov/pubmed/16381911


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM