python文本處理---fasta文件提取指定ID的序列

本文轉載自查看原文 2017-12-12 14:09 2147 Python

利用python腳本，提取指定ID名稱的序列

#!/usr/bin/python3
#-*- coding:utf-8 -*-
#提取指定ID的序列 
import sys args=sys.argv fr=open(args[1], 'r') fw=open('./out.fasta', 'w') dict={} for line in fr: if line.startswith('>'): name=line.split()[0] dict[name]=''
    else: dict[name]+=line.replace('\n','') fr.close() for ID in dict.keys(): if ID ==args[2]: fw.write(ID) fw.write('\n') fw.write(dict[ID])
 fw.write('\n')
 fw.write(str((dict[ID].count('G')+dict[ID].count('C'))/len(dict[ID]))) #計算指定序列中的GC含量 fw.close()

用法：python3 filename 'ID_name'
輸出的結果保存在文件：out.fasta中

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Matlab文本處理：提取指定內容 Python文本處理 python 文本處理操作 Python之路-awk文本處理 Python文本處理nltk基礎 python處理fasta文件，ID和序列放在一行 Linux文本處理 Egret 文本處理 awk文本處理 thymeleaf文本處理