PHI是一個致病菌的數據庫,截止到2017年8月1號為止,最新的版本是4.3,數據庫中收錄了實驗驗證過的致病菌的信息,其中有176個來自動物的致病菌,227個來自植物的致病菌,3個來自真菌的致病菌;
4.3版本中數據庫的具體信息如下:

共收錄了4775個基因, 相互作用有8610條, 致病菌有264種, 宿主有173種,疾病有428種,References 參考文獻有2330種
數據庫網址如下:
http://www.phi-base.org/index.jsp

在數據庫的記錄中,包含以下幾個比較常用的字段的信息:



GENE NAME : 基因名稱
HOSE SPECIES : 宿主的物種名稱
PATHOGEN SPECIES : 致病菌的名稱
DISEASE NAME : 疾病名稱
PHI-BASE ACCESSIONID : phi-base 數據庫的編號
PHENOTYPE MUTANT : 致病菌導致的表型變化
EXPERIMENTAL EVIDENCE : 實驗證據
MULTIPLE MUTATION :
以基因 AcpC 為例,進行檢索

在輸入框中輸入基因名稱,點擊SEARCH 按鈕,檢索出來的結果如下:

圖片左側的輸入框提供了不同的篩選項,可以根據Year等因素對結果進行進一步篩選,右側的表格是檢索出的最終結果
phi-base 是可以免費下載的,首先需要注冊一個賬號,點擊Download 按鈕會提示注冊賬號,注冊的過程就不詳細寫了,注冊完成之后就可以看到下載鏈接:

phi-base 提供了兩種下載方式:
第一種:下載fasta格式的序列,可以方便的用構建本地版的blast數據庫,對基因進行功能注釋
第二種:csv格式的整個數據庫,這種下載方式得到的信息更加全面
下載到的fasta部分內容如下:
>A0A023H5D8#PHI:6442#EepR#615#Serratia_marcescens#reduced_virulence MDNNHQKFDSQSIANRVRELFLHYGIGKRQHARELSRILDLSFSHAHRKLKGQSPWTLEQINSVAAALGETPAAIADLSAEHETTEPNMARDAIFFVAGVAMPCVGHIGDELPAGRPAEFVALRVEGQWHIYRADEAPAGPRYGV >A0A023NA98#PHI:3354#rtxA1#672#Vibrio_vulnificus#reduced_virulence MGKPFWRSVEYFFTGNYSADDGNNSIVAIGFGGEIHAYGGDDHVTVGSIGAKVYTGSGNDTVVGGSAYLRVEDTTGHLSVKGAAGYADINKSGDGNVSFAGAAGGVSIDHLGNHGDVNYGGAAAYNGITRKGLSGNVTFKGAGGY
可以看到為蛋白質序列,可以通過blastp對基因進行致病性的功能注釋
csv格式如下:

csv文件為整個數據庫的所有記錄,包含的字段很多,比較重要的還是之前的幾個字段;
參考資料 : https://www.ncbi.nlm.nih.gov/pubmed/16381911
