前言
關於蛋白質組學,你是不是已經聽了太多公司的宣講,介紹了一大堆的技術名詞,反而越聽越懵懂,腦袋一團亂麻?就和傳話游戲一樣,當我們接收了多手信息以后,得到的信息就越不准確。那么,何不自己看一看第一手信息呢?比如說DIA。
這里只推薦兩篇綜述。
第一篇是蛋白質組學泰山北斗的Ruedi Aebersold和Matthlas Mann合作發的,該文不止介紹DIA,是對整個目前蛋白質組的bottom-up得研究策略做的一個總結和展望。
整個bottom-up的蛋白質組學研究流程如下圖所示:
第二篇也是Ruedi寫的,特別針對DIA的綜述,值得一讀。雖然兩篇文章都是三四年前發的,但整個領域這幾年也沒什么太大的進步,依舊可以當成新的看。
個人厘清:
- 大佬們把當前bottom-up的蛋白質組學研究分為三種類型:DDA、靶向和DIA,DDA研究的蛋白覆蓋廣,靶向研究准確性高,而DIA研究結合了兩者的優點(實際上是有爭議的,尤其在譜圖解析的速度和准確性上)。
- DDA(Data Dependent Acquisition)和DIA(Data Independent Acquisition)只是兩種數據采集模式,即離子全采集還是部分采集,而非某種具體的蛋白質定量方法(如DDA labelfree、iTRAQ等)。其方法是:將整個質譜掃描質量范圍分為若干小窗口,依次對每個窗口的所有離子進行碎裂,使其能夠對掃描區間內的所有肽段離子進行高速一級MS掃描,再進行二級MS/MS分析。
- SWATH(Sequential Window Acquisition of all Theoretical Mass Spectra)只是若干DIA技術中的一種,由ETH Zürich的Ruedi Aebersold團隊與AB SCIEX公司合作開發。同時期還有Waters公司也開發了一種叫全信息串聯質譜(MSE)的DIA技術,不過現在沒怎么聽說了。因為Ruedi是和AB公司合作的,所以質譜儀用的QTOF,專門開發出這樣一種SWATH采集模式,相應的Ruedi團隊開發了一個叫openSWATH的軟件用來解析譜圖(我們從上面綜述可以看出)。所以人們就把DIA和SWATH這兩個名詞混用了。
- Thermo Fisher公司不甘示弱,利用自己分辨率強大的Orbitrap質譜儀也開發出這樣一種全掃模式,並且干脆不起名字,就叫DIA,后來還搞了個升級版本,將多重累積技術與 DIA 相結合,稱之msxDIA,當然為了凸顯自己的優勢,總是不忘和QTOF做對比,提提SWATH的缺點。這樣一來,名稱上就顯得更加混亂了,現在大家默認為新技術是DIA,舊的是SWATH,其實就只是儀器不同而已。但Thermo可沒有Ruedi的加持,只有自己主要做DDA數據的配套軟件Proteome Discoverer來解析當然不行,於是引入Skyline 軟件(華盛頓大學 MacCoss 教授開發,主要是做靶向蛋白質組學),通常做法就是用PD建庫,用Skyline解析。當然openSWATH也是可做Orbitrap數據的。
DIA工具
DIA數據解析需要用到的工具現如今也是越來越多的,但好用的也沒幾個,不完全統計如下。
1.建庫軟件
主要是平時用的蛋白搜庫軟件,如:
- MaxQuant
- pFind
- Comet
- Mascot
- X!Tandem
- Proteome Discoverer
- Sequest
- MS GF+
- OMSSA
- MSFragger
- DeepMass
- Prosit
- pDeep
- SpectraST
- iSwathX
- specL
- DeepRT
2. 依賴庫的DIA軟件
- OpenSWATH(用的較多,免費開源,Linux)
- EncyclopeDIA
- Scaffold DIA
- Skyline(用的較多,免費,Win)
- Spector
- Percolator
- PyProphet
3. 用不用庫都可以的DIA軟件
- DIA-NN(去年新發NM,深度學習方法,有潛力)
- Spectronaut(用的較多,准確性高,速度慢,收費,Win)
- PEAKS(收費,可做denovo,Linux或雲服務器)
4. 無需庫的DIA軟件
- DIA-Umpire
- PECAN
- Group-DIA
5. 做統計驗證的軟件
- mProphet
- pyProphet
- Percolator
以上工具部分參考了西湖大學郭天南老師的課件,祝文章早日見刊!