使用bowtie2 tophat2 及 cufflinks 处理RNA-SEQ数据


未经本人授权禁止转载

1 安装bowtie2

ubuntu上用bin装ok,suse上编译装的,中间包依赖有问题,可用zypper安装所需包

2 安装tophat2

ubuntu上用bin装ok,suse上执行的时候报找不到samtools,但是官网上手册说tophat2不需要samtools。。

装samtools吧,gcc编译时找不到lcurses库,发现把makefile里面lcurses换成lncurses即可。

但是后来发现tophat2即使装了samtools还是报错,算了编译安装tophat2吧

http://ccb.jhu.edu/software/tophat/manual.shtml

tophat2的文档写的还是可以的

 

tophat -G .gff注释文件 -o 输出路径 bowtie产生的index文件 Sample1_1.fq Sample1_2.fq

 

注意gff文件和fa文件的header需保持完全一致,否则会报错,另外如果在win下处理这两个文件(比如用python调整格式),输出后的文件需要用ue将其转为unix格式(换行符不同),否则也会报gtf_to_fasta的错。index文件夹下要放原来用来做索引的fa文件,否则也报gtf_to_fasta的错,这是不合理的,但原因不明。

 

cuffmerge对fasta序列的要求比较严,注意每个fasta序列每一行的长度(除了最后一行)长度都要相等,注意去除空行和不必要的换行。否则报:

No fasta index found for ./input1. Rebuilding, please wait.. Error: sequence lines in a FASTA record must have the same length!

 

cuffdiff的目标序列注意同一个条件下多个样品序列之间用','分隔且中间不能有空格,有空格则会被识别为不同的条件,因而条件的label数和条件数不同,因此报:

Error: number of labels must match number of conditions


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM