1.簡介
Mascot是非常經典的蛋白鑒定軟件,被Frost & Sullivan形容為“質譜數據檢索的黃金標准”,更新維護速度也很快(已發布到2.7版New features in Mascot Server 2.7)。but,它是商業軟件(國內康昱盛代理),收費。雖然有在線版本,但僅支持少量譜圖檢索,只能體驗一下。大規模的蛋白組搜索必須使用它們的服務器。簡述下特點:
- 支持目前主流的三種檢索算法:即2D-PAGE + MALDI的 Peptide Mass Fingerprint (PMF),LC-MS或復雜MALDI的MS/MS Ion Search,以及Sequence Query功能進行分子量和碎片離子信息聯合搜庫。
- 特有的基於隨機匹配概率的打分方法(另一種是經典的SEQUEST 2次打分算法),支持標准統計顯著性檢驗分析
- 整合FDR閾值選項及Percolator大規模數據檢索質量控制算法
- 可檢索各種類型數據庫,包括序列庫和譜圖庫,也可自定義
- 支持幾乎所有常用的質譜儀輸出的數據格式
- 支持Web瀏覽器,給出概述性和詳細的結果報告
mascot官網包含的東西很多,除了產品,它還提供了training的資料,blog和help文檔,對於蛋白質組學入門者而言,可以多瀏覽了解了解。
2.配置
Mascot服務器蛋白搜庫功能:
2.1在線版本
這里主要介紹串聯質譜檢索方法MS/MS Ions Search。點擊進入Perform search
對主要的參數進行配置,比如數據庫,物種,酶切,漏切,可變修飾,固定修飾,一二級誤差及其單位,肽段價態,上傳文件及格式,是否構建反庫等。以下是一個簡單的配置示例,僅供參考:
2.2 服務器版本
如果mascot部署已部署在本地服務器(如我們廠搭建在了集群上),需要通過服務器端口對酶、修飾、物種數據庫等參數進行配置,然后在Linux環境中運行。mascot配置界面如下:
例如對物種數據庫進行配置Databasea Maintenance
當然,如果你已經建好了庫,下次可以從中選擇繼續用就行。建好庫的標志就是在MASCOT search status page中顯示In use
,在Linux中則出現seq.a00, seq.errors , seq.fasta, seq.i00, seq.s00, seq.stats
等文件
mascot服務器在Linux中的搭建和配置是比較復雜的,安裝和配置指南我提供了一個文件供參考:
鏈接: https://pan.baidu.com/s/1IXkPqQ5k-Q-Y0bvvDga6mw
提取碼: 5m1a
3.運行
3.1 在線版本
上傳mgf譜圖文件,點擊start search
即可進行在線檢索,但這個檢索支持的譜圖數非常有限,體驗一下即可。
PS:第一次提交不會立即執行,會發送消息到郵件需要你驗證,然后再配置運行。
3.2 服務器版本
Linux服務器版本,配置好數據庫及其他參數后,可調用以下命令:
nph-mascot.exe 1 -commandline -f test.dat < test.asc
得到mascot鑒定結果,並通過mascot提供的解析腳本export_dat.pl,得到進一步的詳細結果:
perl export_dat.pl file=test.dat do_export=1 prot_hit_num=1 prot_acc=1 pep_query=1 pep_rank=1 pep_isbold=1 pep_isunique=1 pep_exp_mz=1 _quant_protein_ratio_type=median _quant_outliers_method=auto _min_precursor_charge=1 _quant_min_num_peptides=2 _quant_unique_pepseq=1 _quant_pep_threshold_type="at least identity" _quant_norm_method=median export_format=CSV _sigthreshold=0.05 _ignoreionsscorebelow=0.05 report=AUTO _server_mudpit_switch=0.000000001 show_same_sets=1 _requireboldred=1 search_master=1 show_header=1 show_decoy=1 show_mods=1 show_params=1 show_format=1 protein_master=1 prot_score=1 prot_desc=1 prot_mass=1 prot_matches=1 prot_cover=1 prot_seq=1 prot_quant=1 peptide_master=1 pep_exp_mr=1 pep_exp_z=1 pep_calc_mr=1 pep_delta=1 pep_start=1 pep_end=1 pep_miss=1 pep_score=1 pep_homol=1 pep_ident=1 pep_expect=1 pep_seq=1 pep_var_mod=1 pep_scan_title=1 pep_quant=1 use_homology=1 > test.csv
4.結果
一般而言,mascot得到的鑒定結果是.dat
文件(當然也導出其他格式)。dat源文件比較復雜,常人是看不懂的(截取部分):
這時就有很多其他軟件來對dat進行解析處理或者可視化。
對於官網提供的在線版本,mascot將結果生成了一份在線報告形式,清晰易懂。我這里就對結果不進行過多解釋,不明白的地方也可查看help。
當然,我們也可以將dat文件導入如iQuant軟件進行標記定量,或者導入PDV等譜圖可視化軟件來進行鑒定結果查看。
Ref:
http://www.cloudscientific.com/plus/view.php?aid=11
https://www.bio-equip.com.cn/show1equip.asp?equipid=439471
蛋白質組學鑒定定量系列軟件總結:
【1】蛋白鑒定軟件之X!Tandem
【2】蛋白鑒定軟件之Comet
【3】蛋白鑒定軟件之Mascot
【4】蛋白質組學鑒定軟件之MSGFPlus
【5】蛋白質組學鑒定定量軟件之PD
【6】蛋白質組學鑒定定量軟件之MaxQuant