python處理fasta文件，ID和序列放在一行

本文轉載自查看原文 2017-12-11 15:13 3331

#!/usr/bin/python
#-*- coding:utf-8 -*-
"處理fasta文件，將ID號和序列放在一行"
import sys
with open(sys.argv[1]) as f:
    fw=open('out.fasta', 'w')
    line=f.read()
    line=line.replace('\n', '').replace('>', '\n>')
    for aa in line:
        fw.write(aa)
    fw.close()
"""
>chr1|hos107.1#gene1
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTCCCCCCAAAGGGG
>chr1|hos107.2#gene2
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
>chr1|hos107.4#gene3
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
>chr1|hos107.5#gene4
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
"""
"""
>chr1|hos107.1#gene1ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTCCCCCCAAAGGGG
>chr1|hos107.2#gene2ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
>chr1|hos107.4#gene3ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
>chr1|hos107.5#gene4ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
"""

#提取目標序列
f=open('./out.fasta', 'r')
fw=open('target.fasta', 'w') 
for line in f.readlines():
    if line.startswith('>chr1|hos107.1'):
        fw.write(line)
f.close()
fw.close()


"""可以從上述處理好的單行文件out.fasta中提取指定目標ID的文件，並將其
寫入到target.fasta文件中"""

#整體思路：
#先統一fasta文件格式從test.fasta----out.fasta
#取出目標ID序列：out.fasta----target.fasta

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 linux awk常用操作（快速將fasta格式的序列改成一行顯示） linux 系統中shell實現將fasta文件的鹼基轉換為一行及還原 samtools faidx 命令處理fasta序列 Python一行代碼處理地理圍欄 python 讀取文件最后一行 python 刪除文件某一行 python讀取文件首行和最后一行根據bed文件從fasta文件中獲取基因序列【python】文件處理行與行之間的內容 Python 一行代碼