1、KEGG簡介
KEGG 數據庫於 1995 年由 Kanehisa Laboratories 推出 0.1 版,目前發展為一個綜合性數據庫,其中最核心的為 KEGG PATHWAY 和 KEGG ORTHOLOGY 數據庫。在 KEGG ORTHOLOGY 數據庫中,將行使相同功能的基因聚在一起,稱為 Ortholog Groups (KO entries),每個 KO 包含多個基因信息,並在一至多個 pathway 中發揮作用。而在 KEGG PATHWAY 數據庫中,將生物代謝通路划分為 6 類,分別為:細胞過程(Cellular Processes)、環境信息處理(Environmental Information Processing)、遺傳信息處理(Genetic Information Processing)、人類疾病(Human Diseases)、新陳代謝(Metabolism)、生物體系統(Organismal Systems),其中每類又被系統分類為二、三、四層。第二層目前包括有 43 種子 pathway;第三層即為其代謝通路圖;第四層為每個代謝通路圖的具體注釋信息。
KEGG目前含有18個數據庫,分為三大類(系統信息、基因組信息、化學信息)

2、KEGG簡單探索
首先打開KEGG數據庫,你會進入下面這個界面,我們直奔主題,點擊KEGG PATHWAY。 
點擊進去之后,你看到的界面是下面這樣的。

點擊cellular process,頁面迅速的跳到這部分的二級pathway了,這時你可以看到二級通路下面,更細化的通路。

再點擊三級分類的通路,就可以找到我們想要的pathway map了。比如點擊三級分類pathway map 的“cell cycle”,然后就進入了下面這樣的界面。

注意哈,一般默認是人的pathway,如果你像查看其他物種上的pathway,你需要點擊下拉三角形,選擇你所關心的物種。如下面圖中所示哈。

3、KEEGG代謝通路圖解讀


KEGG pathway中有着大量的通路圖,以PI3K-Akt signaling pathway(ko04151)為例,里面包含了大量的蛋白等化合物,以及它們之間相互作用的關系。 


總結:pathway 和 GO富集分析結果的解讀,應該從生物學意義的角度出發,P value 和 Q value只是個參考而已,那些不顯著的通路也值得解讀(從功能注釋的角度解讀,而不是從富集分析的角度解讀)。只要結果可以解釋,有意義,不用太迷信P value。
4、代謝通路可視化
以下三個圖是主要使用 pathview, KEGGREST和KEGGgraph這三個R包繪制的。我是根據例子教程繪制的,具體原理我還沒有弄明白。


原圖在KEGG的鏈接是http://www.genome.jp/kegg-bin/show_pathway?map01100
還有其他一些軟件:
clusterProfiler:https://www.bioconductor.org/packages/devel/bioc/vignettes/clusterProfiler/inst/doc/clusterProfiler.html
Reactome: http://www.reactome.org/
ReactomePA:https://www.bioconductor.org/packages/release/bioc/vignettes/ReactomePA/inst/doc/ReactomePA.html
5、KEGG API
https://www.kegg.jp/kegg/rest/keggapi.html
命名規范:
1)kegg genes
KEGG基因是所有完整基因組(見發布歷史)的基因目錄的集合,由公共資源生成,主要是NCBI RefSeq和GenBank。通過KOALA tool進行SSDB計算和KO分配(基因注釋)。
kegg genes命名規則:<org>:<gene>,其中<org>是三或四個字母的KEGG生物縮寫名,<gene>是基因標識符,通常是NCBI GeneID或INSDC Locus_tag
kegg genes 的來源:

2) Gene Annotation
KEGG基因的注釋涉及到KO標識符(K數)的分配。在內部是依據SSDB數據庫使用KOALA and GFIT工具。而對外部人員來說是用:
BlastKOALA: automatic KO assignment by BLASTP search
GhostKOALA: automatic KO assignment by GHOSTX search
參考資料
http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=235&highlight=KEGG
http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=330&highlight=KEGG
http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=270&highlight=KEGG
http://www.omicshare.com/forum/thread-832-1-12.html(GO、PATHWAY富集分析中是否一定需要選擇顯著富集的通路)
https://github.com/dgrapov/TeachingDemos/blob/master/Demos/Pathway%20Analysis/KEGG%20Pathway%20Enrichment.md
轉載自https://mp.weixin.qq.com/s/pqbMXMkuqEXbLf31PTxGZQ
