從TCGA數據庫官網下載數據


TCGA數據庫 是 生物信息分析經常需要用到的數據庫,今天學習了一下怎么在其官網上下載數據集

以下以下載腎上腺皮質癌患者的miRNA表達數據為例,來講解具體的過程

第一步,打開TCGA網址:https://portal.gdc.cancer.gov

 

第二步,點擊導航欄最右側的 Repository,進入倉庫

 

第三步,點擊左側導航欄的 Cases后,找到 Program項目中的 TCGA,再找到 Project 中的ACC

 

 第四步,點擊左側導航欄的 Files后,按照下圖所示,分別選擇選項

 

 此時,我們會看見我們所選擇的篩選條件顯示在右側,並且也能看到一共有80個病例的80個文件。

 

第五步,將所有的文件添加至購物車

 

 此時右上角的購物車圖標就會顯示現在的文件數量,我們點擊這個圖標,進入購物車

 

第六步,正式開始下載文件啦。

因為文件大小的原因,如果文件大小沒有達到限制的大小,那么就可以直接下載,否則就需要下載官方的下載器來下載。

直接下載:點擊 Download --> Cart

 

 官方下載器下載:

首先,下載官方下載器:https://gdc.cancer.gov/access-data/gdc-data-transfer-tool;往下拉,找到下載位置,直接下載即可

 

下載后,我的放置位置如下圖,這個很重要

 

 

其次,回到TCGA購物車頁面,下載目錄文件,這個可以直接下載的,然后也要記住放置位置

最后,打開cmd,使用命令行來下載文件就可以了,具體的參考 https://blog.csdn.net/weixin_42512684/article/details/89415482(好累,最后放一張最重要的圖,其他的就不寫了)

 

 

 

 如果gdc-client的保存路徑沒有配置到環境變量,那么命令行里需要使用絕對路徑


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM