rMATS輸出結果文件只有表頭


問題

我在用rMATS turbo做可變剪切分析。然而運行程序發現輸出結果文件里只有表頭:

解決方法1

這個問題在軟件github有幾個issues提到過類似問題,如 most output files with only a header
說可能是由參數--readLength設置得和實際的read長度不符導致的。加個參數--variable-read-length即可。

解決方法2

根據測序數據正確設置好-t 參數。單端數據使用 -t paired也是會導致沒結果

其他情況

要是上面那個方法沒解決問題就麻煩了,我是被這折騰了很久了。。又不報錯,但就是沒結果。

我是在CentOS7服務器上安裝的,從github里下載rMATS turbo v4.1.0源碼,進入軟件目錄通過命令build:

./build_rmats --conda

激活rMATS創建的環境使用,
我使用從ENCODE上下的BAM文件(單端測序數據比對的BAM文件),按照軟件文檔給例子進行參數輸入運行后,沒結果。

試了幾個數據,都不行。

然后我試着自己從fastq文件使用bowtie2比對得到BAM文件,然而還是不行。

無語的是,我用實驗室自己比對的BAM文件(雙端測序數據)來測試,tmd居然出結果了!(rMATS支持單雙端數據的)

最后,我試着直接將fastq文件作為輸入,運行rMATS程序,這次成功得出結果!!!

其他

對於使用fastq文件作為rMATS輸入的話,只能以fastq文本格式作為輸入,不能以壓縮格式。默認STAR工作線程數時4,而rMATS並未提供參數設置。
所以需要支持fastq.gz壓縮文件和設置更多的線程數的話,需要編輯rmats.py文件的62行(可能有變動,以實際情況為准),添加修改STAR參數:

不過我更推薦將STAR比對的部分單獨提出來寫個腳本運行。

更新

rmats當前最新版本是4.1.1
能自動識別后綴是不是gz。所以無需添加--readFilesCommand zcat參數了,以及可以設定線程數通過'--nthread' (github最新)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM