一:利用pilon软件进行二代数据对三代数据polish 准备数据 : 三代数据组装好的基因组文件:draft.fa illumina的双端测序数据经过质控之后的数据:read1_fq.gz read2_fq.gz 比对(bwa) 构建索引 ...
对初步组装进行polish 以FASTA和BAM文件作为输入,根据比对结果对输入的参考基因组进行提高,包括 单碱基差异 小的插入缺失 indels 较大的插入缺失或者block替换 填充参考序列中的N 找到局部的错误组装 最后输出polish后的FASTA文件 利用第二代数据和第三代数据进行混装 Hybrid assembly ,这种方法充分发挥了第二代数据质量高和第三代数据片段长的优势,组装出来 ...
2019-09-23 11:43 0 556 推荐指数:
一:利用pilon软件进行二代数据对三代数据polish 准备数据 : 三代数据组装好的基因组文件:draft.fa illumina的双端测序数据经过质控之后的数据:read1_fq.gz read2_fq.gz 比对(bwa) 构建索引 ...
用Li Heng开发的Minimap+miniasm进行组装,然后用racon+pilon进行纠错。 三代测序拼装软件,三代测序平台 Nanopore / Pacbio 产生的数据的一个共同点就是,读长长,错误率高,在用于分析之前需要对数据进行特殊处理(consensus,纠错),再进行拼装任务 ...
速度快, 运行内容:一步组装,两轮纠错 “--edge-min”值对基因大小影响特别大,在基因组复杂度低和测序深 ...
# 估算测序深度、reads数目、N50等值(自写perl程序): $ perl ~/TangerScript/fqStat -i sunset.raw.subreads.fastq -g 372m 统计结果如下: # 基因组组装三步走1. Correction 2. ...
三代测序及基于三代数据的基因组组装流程评估 2018-04-04 12:13 名词解释 1D:ONT平台仅测一个DNA分子的一条链,测序通量比2D高但准确率低于2D序列。 2D:bi-directional reads即ONT平台测DNA分子的正负两链 ...
考虑到cnblog不适合基因组领域这种类型的文章, 最终,我自己开通了公众号:碱基矿工,欢迎感兴趣的同学关注! 也可以关注我的知乎:https://www.zhihu.com/people/yellowtree/activities 2018年1月修改:这篇文章写于2013年,首发 ...
项目数据: kongyu_131_PCRfree_.CCAAT_L006_R1_001.fastq.gz (100X)(19G) kongyu_131_PCRfree_.CCAAT_L006_ ...
与核基因组相比,细胞器基因组相对来说,更为保守,并且序列较短,更加易于组装,仅仅根据二代测序reads即可进行组装。 下面简单介绍我在本项目中的方法,仅供参考。 1 数据 本次我使用的二代数据为50X。下机后,首先通过fastq对其进行过滤,改软件操作较为简单,仅仅使用-q 20 ...