原文:报错:RSEM can not recognize reference sequence name chr1!(基因组的bam不能直接用rsem进行表达值计算)

今天使用单端测序的 bam 文件进行表达值calling,命令如下所示: 报错内容为:The SAM BAM file declares less reference sequences than RSEM knows RSEM can not recognize reference sequence name chr tag XM failed Plase check if you provid ...

2021-09-27 13:06 0 141 推荐指数:

查看详情

使用RSEM进行转录测序的差异表达分析

仍然是两年前的笔记 1. prepare-reference 如果用RSEM对比对后的bam进行转录本定量,则在比对过程中要确保比对用到的索引是由rsem-prepare-reference产生的。 可以看到,单纯用bowtie2建的索引和rsem调用bowtie2建的索引 ...

Mon Feb 22 00:49:00 CST 2021 0 983
rsem对转录本进行定量

最近在研究转录本,现在在下载数据,想起来自己有一个博客,就暂且来这里更新一下内容。 要想对转录本进行定量,首先需要下载它的转录数据,将别人上传的SRR文件的名字整理在wheat.txt中,引用 下载后通过sratoolkits将sra数据转化成fq格式 --split-3将sra ...

Mon Nov 15 04:48:00 CST 2021 0 808
genome repeat sequence | 基因组重复序列

基因组里的小写字母的序列就是soft masking,也就是被标记的重复序列。 怎么把重复序列提取出来,保存为bed文件? 参考:Uppercase vs lowercase letters in reference genome ...

Mon Mar 26 08:00:00 CST 2018 0 935
pysam - 多种格式基因组数据(sam/bam/vcf/bcf/cram/…)读写与处理模块(python)

在开发基因组相关流程或工具时,经常需要读取、处理和创建bam、vcf、bcf文件。目前已经有一些主流的处理此类格式文件的工具,如samtools、picard、vcftools、bcftools,但此类工具集成的大多是标准功能,在编程时如果直接调用的话往往显得不够灵活。 本文介绍的是一个处理 ...

Mon Sep 26 20:58:00 CST 2016 0 8381
基因组注释

基因组注释主要包括四个研究方向:重复序列的识别;非编码RNA的预测;基因结构预测和基因功能注释。我们将分别对这四个领域进行阐述。 1 重复序列的识别。 1.1 重复序列的研究背景和意义:重复序列可分为串联重复序列(Tendam repeat)和散在重复序列 ...

Mon Jan 11 19:48:00 CST 2016 0 4001
参考基因组

参考基因组版本命名参考基因组联盟(Genome Reference Consortium),它是由 NCBI,EBI,桑格研究所等机构组成。GRC 利用最佳的技术装配,纠正,增加基因组序列,以此作为在生信分析领域作为参考的基因组。人基因组官名叫 GRCh38 (Genome ...

Sat Jun 12 20:52:00 CST 2021 0 1267
「三代组装」使用Pilon对基因组进行polish

对初步组装进行polish 以FASTA和BAM文件作为输入,根据比对结果对输入的参考基因组进行提高,包括 单碱基差异 小的插入缺失(indels) 较大的插入缺失或者block替换 填充参考序列中的N 找到局部的错误组装 最后输出polish后的FASTA ...

Mon Sep 23 19:43:00 CST 2019 0 556
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM