Uniprot 數據庫是收錄信息最全面的蛋白質數據庫,包含swissport, uniparc, TrEMBL 3個子數據庫;
其中swiss-prot 是手工核對過的 ,非冗余, 有詳細注釋信息的蛋白數據庫,也是最常用的數據庫;
該數據庫收錄了不同物種的蛋白信息,以人類為例,
數據庫中可以看到如下的信息:
http://www.uniprot.org/uniprot/?query=*&fil=organism%3A%22Homo+sapiens+%28Human%29+%5B9606%5D%22
對於研究蛋白質的功能而言,其對應的GO注釋信息時我們最關注的, 以human的 Q8NHS2 蛋白為例,其對應的GO注釋為
http://www.ebi.ac.uk/QuickGO/GProtein?ac=Q8NHS2
可以看到其對應的所有GO注釋信息,包括對應的GO ID, GO的描述信息,以及分類
通過uniprot 數據庫,我們可以知道編碼蛋白的基因,對應的蛋白名稱, 序列,以及GO注釋