代謝是生命體內化學反應的總稱,其所包含的代謝物變化規律可直接反映生命體的健康狀態。非靶向代謝組學(untargeted metabolomics)可以在系統水平測量生命體內生理或病理狀態下所有代謝物的含量變化,為研究其生物學機理提供依據。液相色譜-質譜聯用(LC-MS)技術是代謝組學研究的主要工具之一。為了能夠將采集的質譜數據信息轉變為有效的生物學信息,首先就必須對代謝峰進行代謝物的結構鑒定。然而,到目前為止,在基於 LC-MS 的非靶向代謝組學中,大規模的代謝物結構鑒定仍然是一項非常具有挑戰性的任務,也是代謝組學發展和應用的最大瓶頸之一。
目前最為廣泛采用的代謝物結構鑒定策略是將二級質譜圖(MS2譜圖)與代謝物標准譜圖庫進行匹配進行代謝物鑒定。然而,此法嚴重受限於標准二級譜圖的數目和覆蓋度。目前標准二級質譜圖庫的擴充十分困難,因為小分子代謝物的標准MS2譜圖必須通過采集代謝物標准品獲取,但是目前大量代謝物沒有標准品。此外,到目前為止還沒有一個譜圖庫建立的標准流程,導致不同實驗室和不同儀器采集的譜圖互有差異。最近,也有研究者進行理論MS2譜圖的預測,然而其精確度仍需提高。同時也有研究者開始利用代謝通路來進行代謝物的鑒定,如Mummichog和PIUMet。然而這些算法都基於差異代謝物富集在特定代謝通路或者代謝網絡上的假設,只能鑒定差異表達的代謝特征峰,且准確度有待提高。

2019年4月3日,國際知名學術期刊《Nature Communications》雜志發表了由中國科學院上海有機化學研究所生物與化學交叉研究中心朱正江研究員課題組的最新研究成果Metabolic Reaction Network-based Recursive Metabolite Annotation for Untargeted Metabolomics(https://www.nature.com/articles/s41467-019-09550-x)。在該論文中,研究人員開發了一種基於代謝反應網絡的全新代謝物結構鑒定算法MetDNA(Metabolite identification and Dysregulated Network Analysis)。
在細胞代謝中,一個代謝物可以通過酶催化反應轉變為另外一種代謝物。處在同一個代謝反應中且結構類似的兩個代謝物可定義為一個反應對(reaction pair,RP)和反應對鄰近代謝物(reaction-paired neighbor metabolite)。代謝物的二級質譜圖依賴於其化學結構。因此,處於同一反應對的兩個代謝物由於其類似的結構,其二級譜圖也會有一定的相似性。基於該原理,MetDNA算法利用樣本中已經鑒定出的代謝物作為種子,進一步鑒定其在代謝網絡中鄰近的代謝物。此原理可以迭代應用在新的鑒定出來的代謝物上,從而使MetDNA可以沿着代謝反應網絡進行代謝物的循環鑒定和遞歸運算,直到不再能夠鑒定出新的鄰近代謝物,大大擴展了鑒定到的代謝物的數目。該算法的最大特點是可以通過代謝反應網絡去鑒定沒有標准MS/MS譜圖的代謝物,使得代謝物的結構鑒定並不依賴很大規模的標准MS/MS數據庫。例如,MetDNA方法可以利用20個種子代謝物即可完成>1000個鄰近代謝物的注釋,創新性地克服了代謝物標准MS/MS譜圖庫數目的限制。

研究人員使用MetDNA處理了多個數據集(涵蓋5種物種、7種樣品類型以及多種儀器平台),所有的數據集都能鑒定出來約2,000個代謝物的結構,證明了MetDNA是一個不依賴於平台且較為通用的代謝物結構鑒定算法和工具。為了方便研究人員使用MetDNA,朱正江研究員課題組開發了基於阿里巴巴雲服務器的MetDNA網絡軟件平台(http://metdna.zhulab.cn/)。MetDNA是一個基於網頁版的軟件,主頁如圖所示。用戶需要注冊登錄才能使用。學術用途可以免費使用,商業用途需要聯系朱正江研究員(jiangzhu@sioc.ac.cn)進行商業化授權。詳細的使用方法可以查看MetDNA幫助文檔(http://metdna.zhulab.cn/metdna/help),另外,作者也提供了demo數據(http://metdna.zhulab.cn/metdna/DemoDataset),供用戶下載和測試。

MetDNA相關鏈接
