python文本處理---fasta文件提取指定ID的序列


利用python腳本,提取指定ID名稱的序列

#!/usr/bin/python3
#-*- coding:utf-8 -*-
#提取指定ID的序列 
import sys args=sys.argv fr=open(args[1], 'r') fw=open('./out.fasta', 'w') dict={} for line in fr: if line.startswith('>'): name=line.split()[0] dict[name]=''
    else: dict[name]+=line.replace('\n','') fr.close() for ID in dict.keys(): if ID ==args[2]: fw.write(ID) fw.write('\n') fw.write(dict[ID])
fw.write('\n')
fw.write(str((dict[ID].count('G')+dict[ID].count('C'))/len(dict[ID]))) #計算指定序列中的GC含量 fw.close()

用法:python3 filename 'ID_name'
輸出的結果保存在文件:out.fasta中


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM