Linux下BLAST+的本地化(NCBI-BLAST 2.2.29+):
1. 下載軟件BLAST:
在以下網址 ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
下載: ncbi-blast-2.2.29+-x64-linux.tar.gz (根據自己的操作系統選擇)。
2. 解壓:
解壓后放在任意目錄下都可以,把相應路徑加入PATH變量就是。
比如解壓到用戶的主目錄(/home/yonpen)下,把解壓后的文件夾重新命名為blast,則BLAST+的所有程序在目錄/home/yonpen/blast/bin下。
3. 添加環境變量:
打開終端(Terminal),切換為root用戶,執行vim /etc/profile (需要了解Vim編輯器的基本命令)。
在最末尾添加:
export PATH=/home/yonpen/blast/bin:$PATH
保存退出。(環境變量的值由Blast所在路徑決定。)
此處若成功,注銷以后執行blastn -version會出現版本信息(一定要先注銷或重啟電腦)。
4. 新建:
在目錄/home/yonpen/blast下新建一個文件夾,命名為db 。
在/home/yonpen下新建一個文件,命名為.ncbirc 。(文件名是以點號開頭的)
在文件中添加內容:
[BLAST]
BLASTDB=/home/yonpen/blast/db
5. 下載FASTA格式的數據庫:
ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/
如下載nr.gz。
6. 建立BLAST+可用的數據庫:
打開終端(Terminal),切換到/home/yonpen/blast/db目錄下,執行(以蛋白質庫nr為例):
makeblastdb –in nr -parse_seqids -hash_index -dbtype prot
(需要自己輸入,復制這行命令可能不行,不知道為什么)
7. 使用程序:
如使用psiblast
在目錄/home/yonpen/blast下新建3個文件夾,分別命名為pssm,input,output
設待查詢序列所在文件的名字為a.fasta(一個文件放一條序列,且必須為fasta格式)
執行命令:
psiblast -comp_based_stats 1 -evalue 0.001 -num_iterations 3 -db nr -query input/a.fasta -out output/a.txt -out_ascii_pssm pssm/a.pssm