蛋白質序列位置特異性矩陣(PSSM)的獲取的准備工作:fasta序列的處理


由於獲取位置特異性矩陣需要使用psiblast -db swissprot -query 0.txt -evalue 0.001 -num_iterations 3 -out_ascii_pssm 0.pssm命令獲取,然而該命令只對一個序列比對,如果把大量蛋白質序列輸入,其結果會不斷更新,最后得到最后那個序列的位置特異性矩陣,所以,需要對於蛋白質序列進行分割成多個文件

代碼如下:(這里每個人蛋白質序列所用的長度不同,可根據情況進行調整)

i = 0
fw = open('/blast-2.10.0+/bin/0.txt', 'w')
for line in open('/blast-2.10.0+/bin/1.fa', 'r'):
    fw.write(line)
    i += 1
    if i % 2 == 0:
        fw.close()
        fw = open(str(i) + '.txt', 'w')
fw.close()


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM