原文:samtools faidx输出的fai文件格式解析 | fasta转bed | fasta to bed

fai示例: Sc Sc Sc Sc Sc Sc NAME Name of this reference sequence LENGTH Total length of this reference sequence, in bases OFFSET Offset within the FASTA file of this sequence s first base LINEBASES The n ...

2018-03-25 16:12 0 1346 推荐指数:

查看详情

根据bed文件fasta文件中获取基因序列

第一次写博客,分享一个做的提取基因序列的程序,根据bed文件里的位置信息从基因组里提取序列 源码地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed文件通常用来保存注释基因信息,BED文件必须的3列 ...

Wed Nov 21 02:53:00 CST 2018 0 1142
samtools faidx 命令处理fasta序列

samtools faidx 能够对fasta 序列建立一个后缀为.fai文件,根据这个.fai 文件和原始的fastsa文件, 能够快速的提取任意区域的序列 用法: samtools faidx input.fa 该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行 ...

Fri Feb 19 20:56:00 CST 2016 0 7078
BED文件格式

BED 文件格式 BED 文件格式是一个可变方式的数据线,用来描述注释的数据。BED线有3个要求的字段和9个额外的字段。每条线的字段数目必须是任意单条数据的在注释上一致。可选字段的序试结合低数字的字段必须流行如果高位字段被使用。 首先是三个要求的BED字段 chrom ...

Thu Aug 30 17:56:00 CST 2012 0 3336
BED文件格式

bed文件(browse extensive data)以及gff文件(general fearture format) bed文件 第一列是染色体或者contig信息。 第二列是起始位置,从0开始。 第三列是终止位置。 第四列是bed列的名字。 第五列是score。 第六列是链方向 ...

Tue Mar 10 00:08:00 CST 2020 0 1004
bed文件格式解读

1)BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一个格式 ,提供了一种灵活的方式来定义的数据行,以用来描述注释信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致(见下图)。 每条线的字段 ...

Sun Aug 19 19:43:00 CST 2018 0 811
bedtools神器 | gtfbed | bed文件运算

我们生信技能书有一篇介绍bedtools的文章,可以在微信里搜着看下,非常有用。 bedtools 用法大全 http://bedtools.readthedocs.io/en/latest/ gtfbed用Linux命令完全可以实现,因为gtf每一行比较规律,不像fasta和fastq ...

Sun Mar 25 12:16:00 CST 2018 0 3738
生信文件格式-BED文件

BED文件格式 注释文件就是基因组的说明书。告诉我们哪些序列是编码蛋白的基因,哪些是非编码基因,外显子、内含子、UTR等的位置等等。注释文件在以下三个提供参考基因组的网站中都有提供,比如Ensemble、NCBI 、UCSC。但是现在最权威的人类和小鼠基因组的注释还属Gencode ...

Mon Jun 22 23:56:00 CST 2020 0 580
FASTQ 文件格式转换为 FASTA 格式

1.利用Linux命令:awk 2.用法如下: awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' fastq > fasta 3.上述用法注意事项: fastq文件必须是解压格式 ...

Sat Sep 23 01:10:00 CST 2017 0 4317
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM