代謝物的鑒定流程
蛋白組比基因組和轉錄組落后一檔次,代謝組學比蛋白組又落后一檔次,僅化合物的鑒定就讓人頭疼。
流程如下:
- 化合物精確質量數
- 數據庫檢索
- 一級鑒定(篩選分子量相同的離子)。解決質量數問題。
- 一級鑒定(通過同位素分布比對,篩選分子量和元素組成相同的離子)。解決同位素問題。
- 二級鑒定。通過標准品譜圖庫或者理論二級譜圖庫(公共數據庫)與實際二級譜圖匹配,篩選分子量、元素組成、結構相似的離子。解決同分異構體問題。
細節:
1.合並加和離子。
實驗設計加和形式:M+NH4, M+K, M+Na, M+H-H2O, M+H。質量會發生偏移,保留時間不變。
2.根據質量數匹配進行一級鑒定。
- 對於確定加和形式的,直接用中性質量進行匹配;
- 對於不能確定加和形式的,嘗試使用不同的加和形式進行匹配;如下:
352.1941這個m/z,
假設其加和形式為M+H,則其中性質量為351.1941,通過這個質量數得到兩個匹配結果;
假設其加和形式為M+NH4,其中性質量為335.1941,通過這個質量數得到一個匹配結果;
3.合並同位素峰。
碳原子的兩種同位素形式:C12及C13。
對於上面這個分子:
沒有C13:204.09 Da; 一個C13:205.09 Da;兩個C13:206.09 Da;
沒有C13的稱為單同位素峰;
同位素峰中強度最大的稱為最高同位素峰;
同位素峰強度的加權稱為平均同位素質量;
單同位素峰一般也是最高同位素峰。
4.根據同位素峰相似度進行一級鑒定。
理論同位素峰:根據給定分子式的元素組成即可計算出該分子的理論同位素峰分布。
通過比較理論同位素峰分布與實際檢測到的同位素峰分布的相似度來輔助鑒定。
5.利用二級譜圖庫進行二級鑒定。
- 標品二級譜圖
通過采集標准品得到的譜圖;
存在於數據庫中,或者是通過購買標准品采集而得到;
不同儀器得到的二級譜圖有所差別,但是主要的峰是一致的。 - 理論二級譜圖
通過對一個已知的分子式進行理論碎裂而得到的譜圖。
能夠找到的實際譜圖的數量過少;理論譜圖是實際譜圖的一個有力補充。
6.數據采集模式
同蛋白一樣,也是DDA和DIA兩種。
二級譜圖解析:
通過計算得出母離子a,b的子離子是哪些,在實際的實驗中,通過二級譜圖解析計算得到了每一個母離子的子離子有哪些;
計算軟件:MetFrag;
Waters公司的商業軟件progensis QI集成了解卷積與二級譜圖解析的功能。
7.公共數據庫
HMDB、KEGG、PlanCyc、Lipid Maps、ECMDB、YNDB、BMDB、LipidBlast。
鑒定到的化合物並不都是正確的,可按可信度划分不同等級報到。
----before
從譜圖到峰表
- 原始譜圖
- 處理:
-
峰識別
依據信噪比、最大峰寬、強度低值下限來識別信號峰; -
峰對齊
-- 峰對齊對基於LC-MS、GC-MS平台非常重要,對於基於NMR則相對不那么重要;
-- 峰對齊軟件:XCMS、ChromA、Mzmine;大部分算法都是基於保留時間及質量數進行對齊。 -
合並同位素峰
-
合並加和離子
- 峰強度表