TCGA數據庫 是 生物信息分析經常需要用到的數據庫,今天學習了一下怎么在其官網上下載數據集
以下以下載腎上腺皮質癌患者的miRNA表達數據為例,來講解具體的過程
第一步,打開TCGA網址:https://portal.gdc.cancer.gov
第二步,點擊導航欄最右側的 Repository,進入倉庫
第三步,點擊左側導航欄的 Cases后,找到 Program項目中的 TCGA,再找到 Project 中的ACC
第四步,點擊左側導航欄的 Files后,按照下圖所示,分別選擇選項
此時,我們會看見我們所選擇的篩選條件顯示在右側,並且也能看到一共有80個病例的80個文件。
第五步,將所有的文件添加至購物車
此時右上角的購物車圖標就會顯示現在的文件數量,我們點擊這個圖標,進入購物車
第六步,正式開始下載文件啦。
因為文件大小的原因,如果文件大小沒有達到限制的大小,那么就可以直接下載,否則就需要下載官方的下載器來下載。
直接下載:點擊 Download --> Cart
官方下載器下載:
首先,下載官方下載器:https://gdc.cancer.gov/access-data/gdc-data-transfer-tool;往下拉,找到下載位置,直接下載即可
下載后,我的放置位置如下圖,這個很重要
其次,回到TCGA購物車頁面,下載目錄文件,這個可以直接下載的,然后也要記住放置位置
最后,打開cmd,使用命令行來下載文件就可以了,具體的參考 https://blog.csdn.net/weixin_42512684/article/details/89415482(好累,最后放一張最重要的圖,其他的就不寫了)
如果gdc-client的保存路徑沒有配置到環境變量,那么命令行里需要使用絕對路徑