使用Aspera (ascp 命令)從NCBI高速下載數據


1. 簡介

生物信息研究人員往往需要從NCBI/sra 或者EBI/ENA下載高通量的測序數據。而通過NCBI申請獲得的數據往往需要通過Aspeara進行下載。

2. Aspeara 安裝

$ wget http://d3gcli72yxqn2z.cloudfront.net/connect/bin/aspera-connect-3.5.1.92523-linux-64.tar.gz
$ tar zxf aspera-connect-3.5.1.92523-linux-64.tar.gz
$ sh aspera-connect-3.5.1.92523-linux-64.sh
$ echo 'PATH=$PATH:~/.aspera/connect/bin/' >> ~/.bashrc
$ source ~/.bashrc
$ ascp --help

 

注意,此時軟件安裝在 ~/.aspera/connect/ 目錄下。

 

3. Aspeara 主要參數

Aspera的用法:
$ ascp [參數] 目標文件 目的地址

Aspera的常用參數:
-T
    不進行加密。若不添加此參數,可能會下載不了。
-i string
    輸入私鑰,安裝 aspera 后有在目錄 ~/.aspera/connect/etc/ 下有幾個私鑰,使用 linux 服務器的時候一般使用 ~/.aspera/connect/etc/ asperaweb_id_dsa.openssh 文件作為私鑰。
--host=string
    ftp的host名,NCBI的為ftp-private.ncbi.nlm.nih.gov;EBI的為fasp.sra.ebi.ac.uk。
--user=string
    用戶名,NCBI的為anonftp,EBI的為era-fasp。
--mode=string
    選擇模式,上傳為 send,下載為 recv。
-l string
    設置最大傳輸速度,比如設置為 200M 則表示最大傳輸速度為 200m/s。若不設置該參數,則一般可達到10m/s的速度,而設置了,傳輸速度可以更高。

4. Aspeara 下載參考命令

ascp -QTr -l 300M -k 1 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh  anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/ERR/ERR105/ERR105009/ERR105009.sra ./
 

 

5. 參考博客

http://blog.sciencenet.cn/home.php?mod=space&uid=689440&do=blog&quickforward=1&id=1023672

http://www.chenlianfu.com/?p=2319

http://boyun.sh.cn/bio/?p=1933

https://www.plob.org/article/3013.html

https://www.biostars.org/p/93482/  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM