蛋白質序列位置特異性矩陣(PSSM)的獲取的准備工作：fasta序列的處理

本文轉載自查看原文 2020-04-25 21:49 746 python/ 編程

由於獲取位置特異性矩陣需要使用psiblast -db swissprot -query 0.txt -evalue 0.001 -num_iterations 3 -out_ascii_pssm 0.pssm命令獲取，然而該命令只對一個序列比對，如果把大量蛋白質序列輸入，其結果會不斷更新，最后得到最后那個序列的位置特異性矩陣，所以，需要對於蛋白質序列進行分割成多個文件

代碼如下：（這里每個人蛋白質序列所用的長度不同，可根據情況進行調整）

i = 0
fw = open('/blast-2.10.0+/bin/0.txt', 'w')
for line in open('/blast-2.10.0+/bin/1.fa', 'r'):
    fw.write(line)
    i += 1
    if i % 2 == 0:
        fw.close()
        fw = open(str(i) + '.txt', 'w')
fw.close()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 蛋白質序列位置特異性矩陣(PSSM)的獲取鏈特異性轉錄組測序對鏈特異性建庫的理解蛋白質結構模建初探氨基酸，多肽，蛋白質等敏感性Sensitivity和特異性Specificity的說明蛋白質組學數據的歸一化/標准化處理【4】蛋白質組學鑒定軟件之MSGFPlus Diamond軟件比對蛋白質數據庫 FASTA/Q序列處理神器---seqkit