前言
一般我們挑出一堆感興趣的基因想臨時看看它們的功能,需要做個富集分析。雖然公司買了最新版的數據庫,如KEGG,但在集群跑下來嫌麻煩。這時網頁在線或者本地化工具派上用場了。
DAVID
DAVID地址
以前我會首選DAVID,原因是方便簡單。有人說它數據庫更新慢,不准確(據說被science點名批評了),也有人說它運行慢,數據庫更新慢是硬傷,但我只是大概看下基因集的功能,總體結果不會差到哪里去。至於運行速度我反而覺得比其他工具更快。
使用方法:
注釋結果有很多,挑自己感興趣的數據庫,我一般看GO和KEGG。
校正下超幾何檢驗的Pvalue值,查看結果,結果都有鏈接,很方便查看。
但是DAVID沒有可視化結果,臨時看一看還行。
Metascape
Meatascape地址
Metascape是Cytoscape的一個插件,其數據更新快,覆蓋面廣泛。整合了GO、KEGG、UniProt和DrugBank等多個權威的數據庫,使其不僅能完成通路富集和生物過程注釋,還能做基因相關的蛋白質網絡分析和涉及到的葯物分析。
默認分析Express Analysis
針對小白,直接生成一個簡單明了的報告,圖文並茂,結果包括富集總括、基因列表、基因注釋、富集分析、蛋白互作富集等。並且可以下載excel表,ppt和zip壓縮文件。
網絡圖還可保存為CYS格式,后續放到cytoscape中進行編輯。
定制分析CustomAnalysis
Annotation可以根據自己的需要,選擇感興趣的,想在結果中體現的基因注釋查看與基因注釋 相關的文章")項目來進行勾選。勾選完成之后,點擊左上角的Apply按鈕運行。
Membership支持用戶自行選擇通路富集、生物過程富集、功能相關和產物分析等每一個注釋步驟所用到的數據集,並可以在搜索框中輸入感興趣的字段,比如GO中的某一個或某幾個term,或者一些功能性的描述,以便進行更有針對性地分析。
輸入完成感興趣的字段之后,點擊左側的Search按鈕進行查找,之后點擊左上方Apply生成這一步驟的結果。
Enrichment支持用戶選擇通路和功能富集過程中的各項指標,以及蛋白質互作網絡形成過程中的各項指標。用戶可以根據自己的需求,來設定顯著性閾值,網絡中包含元素的最大或最小值,以及分析步驟中想用到的數據集等參數。
生成報告
報告形式同上。
Enrichr
Enrichr地址
除了支持gene list,還支持bed文件,但支持的gene ID種類比較少。
Enrichr結果將多個數據庫進行比較。除了常用的富集分析,還可展示表觀修飾、轉錄因子結合以及疾病和不同細胞類型中的表達。
但是它展示結果比較單一,各個數據庫結果差異也較大,個人不是很喜歡。
ClueGO
ClueGO也是Cytoscape的插件,在cytoscape中本地化安裝使用,除了做功能富集外,主要是具有強大的繪圖功能,目前被很多文章引用。
以上工具中,DAVID和Metascape甚至clusterProfiler等R包的結果我都只作為參考,真正做分析的時候還是需要用最新的數據庫。當然,Metascape和ClueGO可作為后期繪圖補充。