原文:根据bed文件从fasta文件中获取基因序列

第一次写博客,分享一个做的提取基因序列的程序,根据bed文件里的位置信息从基因组里提取序列 源码地址:https: github.com Liuyuan fastaTools blob master pyGetFasta.py bed文件通常用来保存注释基因信息,BED文件必须的 列: chrom 染色体号 chromStart feature在染色体上起始位置 其实编号为 chromEnd fe ...

2018-11-20 18:53 0 1142 推荐指数:

查看详情

fasta文件序列的排序

同样的名为read_1.fa 的fasta文件,里面有若干序列,如: > ...

Thu May 18 06:03:00 CST 2017 0 1322
统计 fasta 文件序列长度及 GC 含量

注:该脚本适用于序列不断开的情况 可用一下命令将折行的序列合并为一行 运行脚本 升级版,输入文件fasta 格式即可。用 Bio 的 Seq.IO 解析 fasta 文件, 用 python 的内置函数 count() 的计算速度更快。 ...

Sat Jan 14 11:25:00 CST 2017 0 3357
参考基因fasta文件添加index

参考基因fasta文件添加index 命令一 命令二 (投递任务时,500M内存够用) 命令三 这三个命令下来,建立的参考基因组的index够大部分生信流程用 ...

Wed Mar 10 23:50:00 CST 2021 0 268
BED文件格式

BED 文件格式 BED 文件格式是一个可变方式的数据线,用来描述注释的数据。BED线有3个要求的字段和9个额外的字段。每条线的字段数目必须是任意单条数据的在注释上一致。可选字段的序试结合低数字的字段必须流行如果高位字段被使用。 首先是三个要求的BED字段 chrom ...

Thu Aug 30 17:56:00 CST 2012 0 3336
BED文件格式

bed文件(browse extensive data)以及gff文件(general fearture format) bed文件 第一列是染色体或者contig信息。 第二列是起始位置,从0开始。 第三列是终止位置。 第四列是bed列的名字。 第五列是score。 第六列是链方向 ...

Tue Mar 10 00:08:00 CST 2020 0 1004
bed文件格式解读

1)BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一个格式 ,提供了一种灵活的方式来定义的数据行,以用来描述注释信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致(见下图)。 每条线的字段 ...

Sun Aug 19 19:43:00 CST 2018 0 811
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM