python文本处理---fasta文件提取指定ID的序列


利用python脚本,提取指定ID名称的序列

#!/usr/bin/python3
#-*- coding:utf-8 -*-
#提取指定ID的序列 
import sys args=sys.argv fr=open(args[1], 'r') fw=open('./out.fasta', 'w') dict={} for line in fr: if line.startswith('>'): name=line.split()[0] dict[name]=''
    else: dict[name]+=line.replace('\n','') fr.close() for ID in dict.keys(): if ID ==args[2]: fw.write(ID) fw.write('\n') fw.write(dict[ID])
fw.write('\n')
fw.write(str((dict[ID].count('G')+dict[ID].count('C'))/len(dict[ID]))) #计算指定序列中的GC含量 fw.close()

用法:python3 filename 'ID_name'
输出的结果保存在文件:out.fasta中


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM