問題
我在用rMATS turbo做可變剪切分析。然而運行程序發現輸出結果文件里只有表頭:
解決方法1
這個問題在軟件github有幾個issues提到過類似問題,如 most output files with only a header
說可能是由參數--readLength
設置得和實際的read長度不符導致的。加個參數--variable-read-length
即可。
解決方法2
根據測序數據正確設置好-t 參數。單端數據使用 -t paired也是會導致沒結果
其他情況
要是上面那個方法沒解決問題就麻煩了,我是被這折騰了很久了。。又不報錯,但就是沒結果。
我是在CentOS7服務器上安裝的,從github里下載rMATS turbo v4.1.0源碼,進入軟件目錄通過命令build:
./build_rmats --conda
激活rMATS創建的環境使用,
我使用從ENCODE上下的BAM文件(單端測序數據比對的BAM文件),按照軟件文檔給例子進行參數輸入運行后,沒結果。
試了幾個數據,都不行。
然后我試着自己從fastq文件使用bowtie2比對得到BAM文件,然而還是不行。
無語的是,我用實驗室自己比對的BAM文件(雙端測序數據)來測試,tmd居然出結果了!(rMATS支持單雙端數據的)
最后,我試着直接將fastq文件作為輸入,運行rMATS程序,這次成功得出結果!!!
其他
對於使用fastq文件作為rMATS輸入的話,只能以fastq文本格式作為輸入,不能以壓縮格式。默認STAR工作線程數時4,而rMATS並未提供參數設置。
所以需要支持fastq.gz壓縮文件和設置更多的線程數的話,需要編輯rmats.py
文件的62行(可能有變動,以實際情況為准),添加修改STAR參數:
不過我更推薦將STAR比對的部分單獨提出來寫個腳本運行。
更新
rmats當前最新版本是4.1.1
能自動識別后綴是不是gz。所以無需添加--readFilesCommand zcat
參數了,以及可以設定線程數通過'--nthread' (github最新)