【文章推荐】根据bed文件从fasta文件中获取基因序列

原文：根据bed文件从fasta文件中获取基因序列

第一次写博客，分享一个做的提取基因序列的程序，根据bed文件里的位置信息从基因组里提取序列源码地址：https: github.com Liuyuan fastaTools blob master pyGetFasta.py bed文件通常用来保存注释基因信息，BED文件必须的列: chrom 染色体号 chromStart feature在染色体上起始位置其实编号为 chromEnd fe ...

2018-11-20 18:53 0 1142 推荐指数：

查看详情

fasta文件中序列的排序

同样的名为read_1.fa 的fasta文件，里面有若干序列，如： > ...

samtools faidx输出的fai文件格式解析 | fasta转bed | fasta to bed

fai示例： Sc0000003 2774837 10024730 60 61 Sc0000004 2768176 12845826 ...

统计 fasta 文件序列长度及 GC 含量

注：该脚本适用于序列不断开的情况可用一下命令将折行的序列合并为一行运行脚本升级版，输入文件是 fasta 格式即可。用 Bio 中的 Seq.IO 解析 fasta 文件，用 python 的内置函数 count() 的计算速度更快。 ...

参考基因组fasta文件添加index

参考基因组fasta文件添加index 命令一命令二 (投递任务时，500M内存够用) 命令三这三个命令下来，建立的参考基因组的index够大部分生信流程用 ...

BED文件格式

BED 文件格式 BED 文件格式是一个可变方式的数据线，用来描述注释的数据。BED线有3个要求的字段和9个额外的字段。每条线的字段数目必须是任意单条数据的在注释上一致。可选字段的序试结合低数字的字段必须流行如果高位字段被使用。首先是三个要求的BED字段 chrom ...

BED文件格式

bed文件（browse extensive data）以及gff文件（general fearture format） bed文件第一列是染色体或者contig信息。第二列是起始位置，从0开始。第三列是终止位置。第四列是bed列的名字。第五列是score。第六列是链方向 ...

bed文件格式解读

1）BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一个格式 ,提供了一种灵活的方式来定义的数据行，以用来描述注释信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致(见下图)。每条线的字段 ...

python处理fasta文件，ID和序列放在一行

...

原文：根据bed文件从fasta文件中获取基因序列

相关推荐

相关标签