【文章推荐】统计 fastq 文件 q20 , GC 含量的软件

原文：统计 fastq 文件 q20 , GC 含量的软件

二代测序的分析过程中，经常需要统计原始下机数据的数据量，看数据量是否符合要求另外还需要统计q ,q ,GC含量等反应测序质量的指标在kseq.h 的基础上稍加改造，就可以实现从fastq 文件中统计这些指标的功能，而且速度非常的快源代码保存为 parse.c , 然后编译 gcc o fastq stat parse.c lz ...

2017-02-14 14:56 6 2483 推荐指数：

查看详情

统计 fasta 文件序列长度及 GC 含量

注：该脚本适用于序列不断开的情况可用一下命令将折行的序列合并为一行运行脚本升级版，输入文件是 fasta 格式即可。用 Bio 中的 Seq.IO 解析 fasta 文件，用 python 的内置函数 count() 的计算速度更快。 ...

测序中Q20 Q30 Q40

你能给别人讲清楚这个概念吗？二代测序中，每测一个碱基会给出一个相应的质量值，这个质量值是衡量测序准确度的。碱基的质量值13，错误率为5%，20的错误率为1%，30的错误率为0.1%。行业中Q20与Q30则表示质量值≧20或30的碱基所占百分比。例如一共测了1G的数据量，其中有0.9G的碱基 ...

使用FastqCount统计fastq文件基本信息？

Reads Total Bases N Bases Q20 Q30 GC 2. ...

统计碱基数目、GC含量、read数、最长的read、最短的read及平均read长度

# 用于fasta格式文件的碱基数目和GC含量的统计 grep -v '>' input.fa| perl -ne '{$count_A=$count_A+($_=~tr/A//);$count_T=$count_T+($_=~tr/T//);$count_G=$count_G+ ...

文件格式——fastq格式

fastQ格式 FASTQ是一种存储了生物序列（通常是核酸序列）以及相应的质量评价的文本格式. 他们都是以ASCII编码的。现在几乎是高通量测序的标准格式。NCBI Short Read Archive也是这格式，多了一些描述性词汇而已。基本格式包含四行，第一行由'@'开始，后面 ...

FASTQ 数据质量统计工具

主流工具： FastQC fqcheck readfq 拿到测序数据的第一步就是做质量控制 fqcheck之后得到的结果：它会统计每条reads，按read 1-100位点计算每个位置的ACGTN含量，以及0-41质量值的个数最终会得到整体的错误率，GC，Q20 ...

二代测序的fastq文件格式介绍

@HWUSI-EAS100R:6:73:941:1973#0/1 GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTT ...

【Python小试】判断一条序列GC含量高低

题目：随便给定一条序列，如果GC含量超过65%，则认为高。编程：测试解析 Python提供了__future__模块，把下一个新版本的特性导入到当前版本，于是我们就可以在当前版本中测试一些新版本的特性。主要解决python2版本中和python3不同的一些问题 ...

原文：统计 fastq 文件 q20 , GC 含量的软件

相关推荐

相关标签