python文本处理---fasta文件提取指定ID的序列

本文转载自查看原文 2017-12-12 14:09 2147 Python

利用python脚本，提取指定ID名称的序列

#!/usr/bin/python3
#-*- coding:utf-8 -*-
#提取指定ID的序列 
import sys args=sys.argv fr=open(args[1], 'r') fw=open('./out.fasta', 'w') dict={} for line in fr: if line.startswith('>'): name=line.split()[0] dict[name]=''
    else: dict[name]+=line.replace('\n','') fr.close() for ID in dict.keys(): if ID ==args[2]: fw.write(ID) fw.write('\n') fw.write(dict[ID])
 fw.write('\n')
 fw.write(str((dict[ID].count('G')+dict[ID].count('C'))/len(dict[ID]))) #计算指定序列中的GC含量 fw.close()

用法：python3 filename 'ID_name'
输出的结果保存在文件：out.fasta中

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 Python之路-awk文本处理 Linux文本处理 Egret 文本处理 python——常用功能之文本处理 Python之mmap内存映射模块（大文本处理）说明再用python写一个文本处理的东东从文本中提取图片路径（java 解析富文本处理 img 标签） boost-字符文本处理 Qt中富文本处理十二、sed文本处理