蛋白組DIA分析:Spectronaut軟件使用指南


官方文檔: https://biognosys.com/media.ashx/spectronautmanual.pdf

0. 准備

Spectronaut軟件是蛋白組DIA分析最常用的譜圖解析軟件之一,優點是定量准確,缺點是高額收費,window版本,速度慢。一起來簡單了解下用法。
image.png
這是它的界面。只要理解了DIA流程,用法其實很簡單,首先構建譜圖庫,或者導入已建好的DDA譜圖庫,再導入DIA原始文件,配置好參數,最后run即可。

一開始需要准備的是各種數據,包括:DIA的rawdata,DDA的rawdata,DDA的database(若有,需加入iRT序列進行校正),DDA的搜庫鑒定結果。如果樣本數多的話,這些原始文件會非常大,剛也提到該軟件只支持windows系統,轉移數據很麻煩,隨便一個項目就能達到500G,所以必須要用很大的內存和硬盤。轉移數據往往要花費很長時間。

1. 譜圖庫構建

首先進入Library,導入譜圖庫。Generate Library from Pulsar...是說用Spectronaut構建譜圖庫;Generate Spectral Library from...是說從別的搜庫軟件構建好的譜圖庫導入,支持常見的搜庫軟件結果文件:
image.png
Import/Exprot Spectral Library是導入導出譜圖庫,這里的譜圖庫是說已經在Spectronaut中完成了的庫。
我們通常是自己導入搜庫軟件的結果文件來構建譜圖庫。

若導入MaxQuant構建的譜圖庫:

導入MaxQuant結果,只需指定combined文件夾導入,軟件會自動關聯相對應的原始數據(DDA的rawdata,關聯也需要一段時間),若原始數據與搜庫結果不在同一個文件夾內,可能會導致關聯失敗,可以通過“Assign Shotgun Files”的方式來指定相應的原始數據(見下圖);關聯后,在FASTA Files一欄選擇相應的數據庫文件(數據庫要右擊上傳,然后點擊左邊倒三角);點擊”Load”后加載Ion library,導入譜圖庫需要一段時間。
image.png
image.png
image.png

導入成功后,左邊Spectral Libraries會顯示出來。點擊左側spectral libraries的名字,更改為相應的項目編號;右側顯示的為spectral library的詳細信息。
image.png

若導入Mascot結果作為譜圖庫:

Mascot的結果通常是dat文件,每一個rawdata對應一個dat。但是Spectronaut要求dat文件名與對應的raw文件同名,即使Assign shotgun files指定rawdata路徑,也會關聯不到,而且要將所有的dat構建一個譜圖庫(這是我們想要的)需要將不同的dat文件整合到同一目錄下,實際上,一個樣本往往多個fraction,同個樣本的多個dat文件一般放在一個目錄中,所以我們要拷貝出來,重命名。如果樣本數多,也是件麻煩的事情。
比如原來每個樣本的6個fraction是這樣的結構:
image.png
image.png

最后需要在同級目錄下同時存在:
image.png
然后導入全部dat文件,會自動關聯對應的rawdata,上傳數據庫,設置參數即可構建譜圖庫了。

常見參數如下,一般默認就好。
image.png
另外還有一點,根據上傳的數據庫類型進行解析。主要是要注意fasta序列的ID及其后面的描述信息等,因為不同來源的數據庫,規則會不同。
image.png

image.png
導入的數據庫格式需要是fasta后綴,fa后綴會識別不了。對於蛋白組來說,大部分數據庫類型都是uniprot(軟件已經給你制定好了,無需定制),若是其他的類型,導入后,根據數據庫制定規則,不會的可以點擊后面的小問號,最后add rule。
image.png
import數據庫后,記得打勾選中。
image.png
最后點擊右下角的load,即導入譜圖庫,導庫的過程可能需要話一段時間。構建譜圖庫的過程可以在日志文件中查看:
image.png
以下是完成后譜圖庫的信息:
image.png

2. DIA解析

舊版本可能是切換到“Review”界面,點擊“Load Raw from File”后導入DIA數據。新的版本是Analysis界面,然后點擊set up a DIA analysis from file,將DIA原始數據導入:
image.png

然后選擇譜圖庫:
image.png

后面的參數默認就好,一步一步點擊next。直到要設置condition實驗設計這一步。需要注意的是圈出來的這幾部分,對照組及重復設置。當然也可以設置好后導入。
image.png

設置condition和replicate的參數來判斷是成對還是非成對,原則是:相同的實驗對象Replicate編號一致,不同的實驗對象Replicate編號務必不同。如下:
image.png

一直點到最后finish,然后一個數據一個數據的開始提峰。
image.png
數據量大的話,提峰很慢,因為要解卷積混合譜圖。可能要默默等上個幾天。

3. 結果導出

提峰完成后,首先是保存工程文件,以sne為后綴。注意是右擊下面這個地方,然后save as:

Spectronaut一旦關閉,完成的結果便會丟失,通過保存工程文件,后續如有重新查看的需求,只需導入工程文件即可,無需重新運行spectronaut。

然后是結果的保存。切換到Report標簽界面。
image.png

你的軟件可能沒有配置好的如下導出結果格式,這個主要是為后續定量分析的軟件使用准備,如R包MSstat。
image.png

一般只有BGS factory report,這時需要自己設置格式。可以對columns進行選擇,也可以filters過濾一些蛋白。當然你也可以全部選中,導出后再處理。

可以對新建立的格式做保存,下次就可以直接用啦。比如下面我對所有列都做了選中(打勾),再save as,命名,點ok:
image.png

最后,export report導出:
image.png

對於MSstats R包,需要導出2種格式文件,一是如下:
image.png

二是蛋白定量文件,導出並命名為PG_Report.xls:
image.png

當然也可以導入或導出制定好的格式,比如我導入:
image.png
不過有個小問題,貌似自己制定的和外部導入是由不同的,也就是說這個藍色陰影和打勾效果不一樣,導入的格式和BGS factory report似乎是同一級別的,而上面新建格式只是在BGS factory report的子文件而已。
image.png
image.png
根據導出的結果看,自己新建的好像不行(這里沒有探究清楚)。


不論如何,我們導出結果。

最后的導出的文件包含如下,包含了工程文件、結果文件、參數及日志等:
image.png

重新導出結果

如果需要重新加載提峰的結果,可以在“Analysis”界面(舊版Review界面)選擇“Load a spectronaut Experiment”,選擇相應的sne文件進行加載。
image.png


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM