由於獲取位置特異性矩陣需要使用psiblast -db swissprot -query 0.txt -evalue 0.001 -num_iterations 3 -out_ascii_pssm 0.pssm命令獲取,然而該命令只對一個序列比對,如果把大量蛋白質序列輸入,其結果會不斷更新,最后得到最后那個序列的位置特異性矩陣,所以,需要對於蛋白質序列進行分割成多個文件
代碼如下:(這里每個人蛋白質序列所用的長度不同,可根據情況進行調整)
i = 0
fw = open('/blast-2.10.0+/bin/0.txt', 'w')
for line in open('/blast-2.10.0+/bin/1.fa', 'r'):
fw.write(line)
i += 1
if i % 2 == 0:
fw.close()
fw = open(str(i) + '.txt', 'w')
fw.close()
