PSIPRED安裝與簡單使用


PSIPRED是什么?

在對氨基酸序列進行機器學習建模時,要對氨基酸序列做特征提取,越豐富的特征通常可以帶來越精准的預測結果,因此可以由原始的氨基酸序列預測出蛋白質的2級結構,水溶性等,豐富特征提取時的特征.PSIPRED是一種簡單而准確的蛋白質二級結構預測工具,它結合兩個前饋神經網絡,對PSI-BLAST結果進行分析處理.更多的信息,參考:http://bioinf.cs.ucl.ac.uk/index.php?id=779

安裝

下載安裝包

  1. 對於BLAST還是BLAST+的選擇,根據官網的建議是仍舊使用BLAST而不推薦使用BLAST+,主要原因是BLAST+在處理蛋白質序列的打分矩陣時做了精度上的降低,故我們本次的安裝選擇BLAST

NCBI are now trying to move users to the new BLAST+ package. Please
see the README file in the BLAST+ subdirectory for more information
on PSIPRED's support for BLAST+. For now the preferred option is
to stick with the classic BLAST package as the default. If the tar
or rpm file you are downloading from NCBI has "+" in the filename,
then you are downloading BLAST+ rather than BLAST.

  1. 對於PSIPRED版本的選擇,經過測試最新的版本V4.02在一切前置條件都安裝且配置正確的情況下,出現子命令blastpgp運行失敗的問題.

tsch安裝

由於PSIPRED使用tsch作為腳本語言,故安裝tsch解釋器

sudo apt install tcsh

經測試V3.5運行無誤,故本次的安裝以V3.5作為基礎前提.

BLAST安裝

BLAST下載並解壓之后即可使用,無需特別編譯安裝

PSIPRED安裝

tar -zxvf psipred3.5.tar.gz
cd psipred/src
make
make install

實際上,在進行編譯和安裝之前,在psipred/bin下已經存在所有所需的命令,但我還是按照README中文檔進行的編譯並安裝,但是當你在安裝時,可以嘗試不編譯安裝是否有何影響.

環境變量

系統環境變量設置

export BLAST_HOME=/home/yizhou/blast-2.2.26
export PSIBLAST=/home/yizhou/psipred
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$SPARK_HOME/bin:$BLAST_HOME/bin:$PSIBLAST/bin

BLAST庫環境設置(重要)

vim ~/.ncbirc
[NCBI]
# 指向Blast data目錄下即可
data=/home/yizhou/blast-2.2.26/data

[BLAST]
# 比對庫存儲路徑,此變量的設置也可以省略
BLASTDB=/data/antibody    
# 指向Blast data目錄,blastpgp在運行時會依賴data目錄下的相關庫文件
BLASTMAT=/home/yizhou/blast-2.2.26/data
``
# 格式化本地比對庫
```bash
gzip -d swissprot.gz
formatdb -i swissprot -n swissprot -t swissprot -p T

修改runpsipred文件

#!/bin/tcsh

# This is a simple script which will carry out all of the basic steps
# required to make a PSIPRED V2 prediction. Note that it assumes that the
# following programs are in the appropriate directories:
# blastpgp - PSIBLAST executable (from NCBI toolkit)
# makemat - IMPALA utility (from NCBI toolkit)
# psipred - PSIPRED V3 program
# psipass2 - PSIPRED V3 program

# NOTE: Script modified to be more cluster friendly (DTJ April 2008)

# 設置比對庫
set dbname = /home/yizhou/sw/swissprot

# 設置blast bin二進制目錄
set ncbidir = /home/yizhou/blast-2.2.26/bin

只設置以上兩個環境變量即可

運行runpsipred

yizhou@master:~/psipred$ ./runpsipred example/example.fasta 
Running PSI-BLAST with sequence example/example.fasta ...
Predicting secondary structure...
Pass1 ...
Pass2 ...
Cleaning up ...
Final output files: example.ss2 example.horiz
Finished.

至此,安裝並結束運行!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM