使用bowtie2 tophat2 及 cufflinks 處理RNA-SEQ數據


未經本人授權禁止轉載

1 安裝bowtie2

ubuntu上用bin裝ok,suse上編譯裝的,中間包依賴有問題,可用zypper安裝所需包

2 安裝tophat2

ubuntu上用bin裝ok,suse上執行的時候報找不到samtools,但是官網上手冊說tophat2不需要samtools。。

裝samtools吧,gcc編譯時找不到lcurses庫,發現把makefile里面lcurses換成lncurses即可。

但是后來發現tophat2即使裝了samtools還是報錯,算了編譯安裝tophat2吧

http://ccb.jhu.edu/software/tophat/manual.shtml

tophat2的文檔寫的還是可以的

 

tophat -G .gff注釋文件 -o 輸出路徑 bowtie產生的index文件 Sample1_1.fq Sample1_2.fq

 

注意gff文件和fa文件的header需保持完全一致,否則會報錯,另外如果在win下處理這兩個文件(比如用python調整格式),輸出后的文件需要用ue將其轉為unix格式(換行符不同),否則也會報gtf_to_fasta的錯。index文件夾下要放原來用來做索引的fa文件,否則也報gtf_to_fasta的錯,這是不合理的,但原因不明。

 

cuffmerge對fasta序列的要求比較嚴,注意每個fasta序列每一行的長度(除了最后一行)長度都要相等,注意去除空行和不必要的換行。否則報:

No fasta index found for ./input1. Rebuilding, please wait.. Error: sequence lines in a FASTA record must have the same length!

 

cuffdiff的目標序列注意同一個條件下多個樣品序列之間用','分隔且中間不能有空格,有空格則會被識別為不同的條件,因而條件的label數和條件數不同,因此報:

Error: number of labels must match number of conditions


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM