由於獲取位置特異性矩陣需要使用psiblast -db swissprot -query 0.txt -evalue 0.001 -num_iterations 3 -out_ascii_pssm 0.pssm命令獲取,然而該命令只對一個序列比對,如果把大量蛋白質序列輸入,其結果會不斷更新,最后得到最后那個序列的位置特異性矩陣,所以,需要對於蛋白質序列進行分割成多個文件
代碼如下:(這里每個人蛋白質序列所用的長度不同,可根據情況進行調整)
i = 0 fw = open('/blast-2.10.0+/bin/0.txt', 'w') for line in open('/blast-2.10.0+/bin/1.fa', 'r'): fw.write(line) i += 1 if i % 2 == 0: fw.close() fw = open(str(i) + '.txt', 'w') fw.close()