【文章推荐】samtools faidx输出的fai文件格式解析 | fasta转bed

原文：samtools faidx输出的fai文件格式解析 | fasta转bed | fasta to bed

fai示例： Sc Sc Sc Sc Sc Sc NAME Name of this reference sequence LENGTH Total length of this reference sequence, in bases OFFSET Offset within the FASTA file of this sequence s first base LINEBASES The n ...

2018-03-25 16:12 0 1346 推荐指数：

查看详情

根据bed文件从fasta文件中获取基因序列

第一次写博客，分享一个做的提取基因序列的程序，根据bed文件里的位置信息从基因组里提取序列源码地址：https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed文件通常用来保存注释基因信息，BED文件必须的3列 ...

samtools faidx 命令处理fasta序列

samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件，根据这个.fai 文件和原始的fastsa文件，能够快速的提取任意区域的序列用法： samtools faidx input.fa 该命令对输入的fasta序列有一定要求：对于每条序列，除了最后一行 ...

BED文件格式

BED 文件格式 BED 文件格式是一个可变方式的数据线，用来描述注释的数据。BED线有3个要求的字段和9个额外的字段。每条线的字段数目必须是任意单条数据的在注释上一致。可选字段的序试结合低数字的字段必须流行如果高位字段被使用。首先是三个要求的BED字段 chrom ...

BED文件格式

bed文件（browse extensive data）以及gff文件（general fearture format） bed文件第一列是染色体或者contig信息。第二列是起始位置，从0开始。第三列是终止位置。第四列是bed列的名字。第五列是score。第六列是链方向 ...

bed文件格式解读

1）BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一个格式 ,提供了一种灵活的方式来定义的数据行，以用来描述注释信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致(见下图)。每条线的字段 ...

bedtools神器 | gtf转bed | bed文件运算

我们生信技能书有一篇介绍bedtools的文章，可以在微信里搜着看下，非常有用。 bedtools 用法大全 http://bedtools.readthedocs.io/en/latest/ gtf转bed用Linux命令完全可以实现，因为gtf每一行比较规律，不像fasta和fastq ...

生信文件格式-BED文件

BED文件格式注释文件就是基因组的说明书。告诉我们哪些序列是编码蛋白的基因，哪些是非编码基因，外显子、内含子、UTR等的位置等等。注释文件在以下三个提供参考基因组的网站中都有提供，比如Ensemble、NCBI 、UCSC。但是现在最权威的人类和小鼠基因组的注释还属Gencode ...

FASTQ 文件格式转换为 FASTA 格式

1.利用Linux命令：awk 2.用法如下： awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' fastq > fasta 3.上述用法注意事项： fastq文件必须是解压格式 ...

原文：samtools faidx输出的fai文件格式解析 | fasta转bed | fasta to bed

相关推荐

相关标签