1⃣️ AnnotationHub
目前最新的工具包叫做AnnotationHub
,顧名思義,就是注釋信息的中裝站。通過它,能找到了幾乎所有的注釋資源。如果沒有,你還可以根據已有的數據用它提供的函數進行構建。
1. 加載AnnotationHub
library(AnnotationHub) ##獲取數據庫
ah = AnnotationHub()
2. 搜索自己所需數據庫並下載
res <- query(ah,"Spinacia oleracea")
spinach_org <- ah[['AH72369']]
注:第一次下載比較慢,以后用就很快
3. 了解常用的5個函數
columns(x): 顯示當前對象有哪些數據
keytypes(x): 有哪些keytypes可用做select或者keys的keytypes參數
keys(x, keytyp,...): 返回當前數據對象的keys (類似於他包含的內部值)
select(x, keys, colums,keytypes,...): 基於keys,columns,返回數據
mapIds(x,keys, columns,keytype,...): 類似select,但是返回一個列
(1)返回這個數據有哪些列:
(2)返回這個數據可以當作關鍵詞進行查找的列:
基本上keytypes
返回的結果是等於或者少於columns返回的結果。因為並不是所有列都能當做查找對象。
(3)keytypes
告訴我們可以當做哪些列是keytype類型,那么keys
則列出這個keytype下有哪些關鍵字。
(4)select 查找
注:有些物種基因組版本更新,在這個數據庫中記載的並無對應基因號,可根據記載的基因號REFSEQ,在NCBI下載,並進行blastp比對,進行替換即可
2⃣️clusterProfiler
library(clusterProfiler) ##富集分析
一般將基因SYMBOL轉為ENTREZID
但是個別會出現不成功,可用
關注下方公眾號可獲得更多精彩