KEGG數據庫介紹


1、KEGG簡介

KEGG 數據庫於 1995 年由 Kanehisa Laboratories 推出 0.1 版,目前發展為一個綜合性數據庫,其中最核心的為 KEGG PATHWAYKEGG ORTHOLOGY 數據庫。在 KEGG ORTHOLOGY 數據庫中,將行使相同功能的基因聚在一起,稱為 Ortholog Groups (KO entries),每個 KO 包含多個基因信息,並在一至多個 pathway 中發揮作用。而在 KEGG PATHWAY 數據庫中,將生物代謝通路划分為 6 類,分別為:細胞過程(Cellular Processes)、環境信息處理(Environmental Information Processing)、遺傳信息處理(Genetic Information Processing)、人類疾病(Human Diseases)、新陳代謝(Metabolism)、生物體系統(Organismal Systems),其中每類又被系統分類為二、三、四層。第二層目前包括有 43 種子 pathway;第三層即為其代謝通路圖;第四層為每個代謝通路圖的具體注釋信息。

KEGG目前含有18個數據庫,分為三大類(系統信息、基因組信息、化學信息)

2、KEGG簡單探索

首先打開KEGG數據庫,你會進入下面這個界面,我們直奔主題,點擊KEGG PATHWAY。 

點擊進去之后,你看到的界面是下面這樣的。 

 
點擊cellular process,頁面迅速的跳到這部分的二級pathway了,這時你可以看到二級通路下面,更細化的通路。 

再點擊三級分類的通路,就可以找到我們想要的pathway map了。比如點擊三級分類pathway map 的“cell cycle”,然后就進入了下面這樣的界面。 

 

 注意哈,一般默認是人的pathway,如果你像查看其他物種上的pathway,你需要點擊下拉三角形,選擇你所關心的物種。如下面圖中所示哈。

 

3、KEEGG代謝通路圖解讀

KEGG pathway中有着大量的通路圖,以PI3K-Akt signaling pathway(ko04151)為例,里面包含了大量的蛋白等化合物,以及它們之間相互作用的關系。 

 總結:pathway 和 GO富集分析結果的解讀,應該從生物學意義的角度出發,P value 和 Q value只是個參考而已,那些不顯著的通路也值得解讀(從功能注釋的角度解讀,而不是從富集分析的角度解讀)。只要結果可以解釋,有意義,不用太迷信P value。

4、代謝通路可視化

以下三個圖是主要使用 pathview, KEGGREST和KEGGgraph這三個R包繪制的。我是根據例子教程繪制的,具體原理我還沒有弄明白。 

 

原圖在KEGG的鏈接是http://www.genome.jp/kegg-bin/show_pathway?map01100

還有其他一些軟件: 
clusterProfiler:https://www.bioconductor.org/packages/devel/bioc/vignettes/clusterProfiler/inst/doc/clusterProfiler.html 
Reactome: http://www.reactome.org/ 
ReactomePA:https://www.bioconductor.org/packages/release/bioc/vignettes/ReactomePA/inst/doc/ReactomePA.html

5、KEGG API

https://www.kegg.jp/kegg/rest/keggapi.html

命名規范:

1)kegg genes

KEGG基因是所有完整基因組(見發布歷史)的基因目錄的集合,由公共資源生成,主要是NCBI RefSeq和GenBank。通過KOALA tool進行SSDB計算和KO分配(基因注釋)。

kegg genes命名規則:<org>:<gene>,其中<org>是三或四個字母的KEGG生物縮寫名<gene>是基因標識符通常是NCBI GeneID或INSDC Locus_tag

kegg genes 的來源:

2) Gene Annotation

KEGG基因的注釋涉及到KO標識符(K數)的分配。在內部是依據SSDB數據庫使用KOALA and GFIT工具。而對外部人員來說是用:

BlastKOALA: automatic KO assignment by BLASTP search

GhostKOALA: automatic KO assignment by GHOSTX search

參考資料

http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=235&highlight=KEGG 
http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=330&highlight=KEGG 
http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=270&highlight=KEGG 
http://www.omicshare.com/forum/thread-832-1-12.html(GO、PATHWAY富集分析中是否一定需要選擇顯著富集的通路) 
https://github.com/dgrapov/TeachingDemos/blob/master/Demos/Pathway%20Analysis/KEGG%20Pathway%20Enrichment.md

轉載自https://mp.weixin.qq.com/s/pqbMXMkuqEXbLf31PTxGZQ

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM