GEO數據庫
GEO數據庫隸屬於NCBI,是最大最全面的基因表達數據庫,主要是芯片和轉錄組測序數據。除儲存數據外,也提供一些數據挖掘工具,因此利用好這個數據庫,沒有實驗,沒有自己的數據也能發好文章!
https://www.ncbi.nlm.nih.gov/geo/
SRA文件的存放
從NCNI的這個站點(https://www.ncbi.nlm.nih.gov/projects/faspftp/)可以看出,sra原始的reads數據是在sra/sra-instant/下的,該目錄下的analysis是分析結果文件
reads目錄下,又分為ByExp,ByRun和ByStudy三個目錄,每個目錄下都有sra子目錄,而且又分為三個子目錄,所以從這里找sra文件是非常繁瑣的。不如從GEO主頁上直接搜索編號。
