從NCBI下載數據本來是一件很簡單的事情,但是今天碰到幾個坑:
1、paper里沒有提供SRA數據號、也沒有提供路徑;
2、不知道文件在ftp的地址,不能直接用wget下載
所以通過在NCBI官網,直接在SRA搜索欄里:

輸入paper的title關鍵詞NIFTY BGI

搜索結果:

選一個文件點擊進去

進去之后,再點擊SRP

然后:

出現如下內容:

然后選擇所有SRR文件:

下載Accession list之后得到文件列表:
SRR354208 SRR357358 SRR357397 SRR357398 SRR357666 SRR357667 SRR357668 SRR357669 SRR357670 SRR357671 SRR357672 SRR357673 SRR357674 SRR357675 SRR357676
然后根據這個列表在linux下載:
[wuzengding@mn01 NIFTY_BGI_samp]$ cat /data1/Medicine/WZD/SRR_Acc_List.txt | while read line
> do
> echo $line
> /home/wuzengding/biosoftware/sratoolkit.2.8.2-1-centos_linux64/bin/fastq-dump.2.8.2 ${line}
> done
下載成功!!
注:另外一種更簡單方法
在找到這個界面時

點擊send to

最后得到SraRunInfo.csv文件,文件內容是各個samp sequence的列表信息,包括FTP上的下載地址:

然后在linux中下載,
完畢!
