NCBI原始數據下載by Aspera Connect


主要參考這篇文章:

http://mp.weixin.qq.com/s?__biz=MzA5NjU5NjQ4MA==&mid=2651154488&idx=1&sn=e693a1a1f8163960e99812a6d7473aa0&scene=23&srcid=0831PboACKYo6omCEfKhXLhV#rd

因為昨天剛裝了centOS,所以這里只貼出linux下的操作:

1. 進入linux服務器,下載aspera。

輸入:wgethttp://downloads.asperasoft.com/download/sw/connect/3.1/aspera-connect-3.1.1.70545-linux-64.tar.gz

將會開始下載。

2. 下載完畢后,解壓,輸入: tar xvf aspera-connect-3.1.1.70545-linux-64.tar.gz

3. 安裝輸入:sh aspera-connect-3.1.1.70545-linux-64.sh

4. cd 到/home/usrname文件夾,ls-a就能看到 .aspera

這就是安裝的文件夾。

5. 重要一步,添加環境變量,否則不能用。輸入  

exportPATH=$PATH:/home/username/.aspera/connect/bin

6. 數據下載。

可以按照這個模板去下載了SRA數據(如果很多可以把所有命令寫到一個shell里面,nohup提交睡大覺去就可以了,明早一醒,全部ok)

nohup /home/usrname/.aspera/connect/bin/ascp -i/home/usrname/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200manonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR949/SRR949627/SRR949627.sra./ &    

可以按照此模板下載基因組相關數據

~/.aspera/connect/bin/ascp -i~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200manonftp@ftp-private.ncbi.nlm.nih.gov:genomes/all/GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz./

其中GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz根據你要下載的基因組改成NCBI FTP上的基因組、GFF和CDS文件名字

其他類型數據類似


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM