做差異表達的軟件DEseq和edgeR所需要的數據格式必須是原始counts,經過normalization和log2后的數據都不適合,所以對於做差異表達計算的童鞋可以使用
ExperimentHub下載TCGA的原始數據。
GEO地址:http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE62944
安裝:
首先安裝環境要求BioC 3.4
## In R-3.3
library(BiocInstaller)
useDevel()
biocValid() # checks for out of date packages
biocLite() # (optional) updates out of date packages
升級到3.4后可以安裝expermentHub
source("https://bioconductor.org/biocLite.R")
biocLite("ExpermentHub")
測試運行OK。
library(ExperimentHub)
eh = ExperimentHub()
query(eh , "GSE62944")
tcga_data <- eh[["EH1"]]
head(phenoData(tcga_data)$CancerType)
