【ThermoRawFileParser】質譜raw格式轉換mgf


眾所周知,Proteowizard MSconvert用於質譜原始數據的格式轉換,但主要平台是windows,要想在Linux上運行需要打Docker或Wine,對於普通用戶來說還是很困難的,想想質譜的數據動輒上百Gb要進行轉換相當麻煩。

比利時根特大學Dr. Lennart Martens領銜的CompOmics group(這個團隊在蛋白質組領域很牛)也開發了專門針對Thermo的raw格式轉化的開源軟件,使用簡單,最主要的是對Linux用戶友好。可轉換的格式包括 mzML(默認),MGF,Parquet。

下載安裝

下載鏈接:
https://github.com/compomics/ThermoRawFileParser/releases

選擇一個版本解壓就可用了(最好新建一個文件夾存放,否則解壓的是在當前目錄中)。

但是,Linux使用還需要通過跨平台軟件Mono來調用。關於Mono的安裝,可能有些普通用戶會碰到問題,主要是依賴libgdiplus庫,只要這個解決了,源碼安裝三部曲就行了,這里不加以贅述。

參數

可以通過mono ThermoRawFileParser.exe查看參數:

usage is ThermoRawFileParser.exe [subcommand] [options]
optional subcommands are xic|query (use [subcommand] -h for more info]):
  -h, --help                 Prints out the options.
      --version              Prints out the library version.
  -i, --input=VALUE          The raw file input (Required). Specify this or an
                               input directory -d.
  -d, --input_directory=VALUE
                             The directory containing the raw files (Required).
                               Specify this or an input raw file -i.
  -o, --output=VALUE         The output directory. Specify this or an output
                               file -b. Specifying neither writes to the input
                               directory.
  -b, --output_file=VALUE    The output file. Specify this or an output
                               directory -o. Specifying neither writes to the
                               input directory.
  -f, --format=VALUE         The spectra output format: 0 for MGF, 1 for mzML,
                               2 for indexed mzML, 3 for Parquet. Defaults to
                               mzML if no format is specified.
  -m, --metadata=VALUE       The metadata output format: 0 for JSON, 1 for TXT.
  -c, --metadata_output_file=VALUE
                             The metadata output file. By default the metadata
                               file is written to the output directory.
  -g, --gzip                 GZip the output file.
  -p, --noPeakPicking        Don't use the peak picking provided by the native
                               Thermo library. By default peak picking is
                               enabled.
  -z, --noZlibCompression    Don't use zlib compression for the m/z ratios and
                               intensities. By default zlib compression is
                               enabled.
  -l, --logging=VALUE        Optional logging level: 0 for silent, 1 for
                               verbose.
  -e, --ignoreInstrumentErrors
                             Ignore missing properties by the instrument.
  -u, --s3_url[=VALUE]       Optional property to write directly the data into
                               S3 Storage.
  -k, --s3_accesskeyid[=VALUE]
                             Optional key for the S3 bucket to write the file
                               output.
  -t, --s3_secretaccesskey[=VALUE]
                             Optional key for the S3 bucket to write the file
                               output.
  -n, --s3_bucketName[=VALUE]
                             S3 bucket name

案例

主要能用到的就1-4個參數,例如:

mono ThermoRawFileParser.exe -i=/home/user/data_input/raw_file.raw -o=/home/user/data_input/output/ -f=0 -g -m=0

至少可用一個參數:

mono ThermoRawFileParser.exe -i=/home/user/data_input/raw_file.raw

mono ThermoRawFileParser.exe -d=/home/user/data_input/

更多用法參考:https://github.com/compomics/ThermoRawFileParser#usage

轉換的過程:
image.png

轉換的結果: 以下結果包含帶壓縮(-g參數)和不帶壓縮的。
image.png


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM