目的
和轉錄組或蛋白組的分析原理類似,目的是:
將大量的差異代謝物降維到少量的顯著富集的代謝通路,方便解釋科學問題;
從通路水平上可以更好解釋表型背后的生物學原理/過程。
富集分析方法
富集分析的本質:某個代謝通路在不同的狀態下(如疾病與健康)是否發生了顯著變化?
ORA富集
回答的問題:一個代謝物集合(如某個代謝通路)中所包含的差異代謝物的數量是否顯著地比隨機取樣獲得的差異代謝物的數量更多?
零假設:代謝通路A中的差異代謝物數量不比隨機取樣獲得的差異代謝物數量多。
備擇假設:代謝通路A中差異代謝物顯著富集。
符合超幾何分布,使用超幾何檢驗或費舍爾精確檢驗。
ORA優點:
計算原理簡單、結果易懂;輸入數據簡單。
ORA缺點:
- 舍棄了很多有用信息,如差異離子的fold change的大小等;
- 僅僅使用了最顯著差異的代謝物,如FC=1.99的被舍棄了;
- 對背景的假定是全部檢測到的代謝物,而實際上應該是全部的代謝物,儀器的檢測偏差會影響富集結果;
- 假定所有的代謝物都是獨立的,而實際上它們不是獨立的。代謝物間存在協同作用,一個代謝物可以屬於不同的代謝通路。
FCS富集
Functional class scoring。
代謝通路的變化程度應該用該通路中所有注釋到的離子的變化情況來衡量。若該通路中每一個代謝物都有相同趨勢的變化,盡管單個代謝物不顯著,該通路依然是顯著變化的。
計算過程:
- 計算每一個代謝物的顯著性,如fold change,p值等;
- 根據某一個通路中所有注釋到的代謝物的變化情況計算通路水平的顯著性;計算方法可以是多變量的,如Kolmogorov-Smirnov statistic,也可以是簡單的單變量的,如代謝物水平顯著性的和,均值,中值等。
- 根據通路的顯著性,篩選有顯著變化的通路。
FCS優點: - FCS不僅僅考慮差異代謝物,其考慮是某個通路中全部的代謝物的變化;
- ORA忽略了代謝物的變化程度,而FCS將代謝物變化程度考慮了進來;
- FCS考慮注釋到某個通路中的全部代謝物的變化,考慮了代謝物間的協同作用關系。
FCS缺點: - FCS一次只考慮一個通路,而不同通路之間的代謝物是有重疊的,FCS並沒有考慮這種重疊關系;
- 大部分FCS算法在考慮代謝物變化程度的時候用的是變化程度的排序;如A代謝物的fold change是20 或者2,只要他們的排序一樣,在FCS中就一樣。
工具
代謝物富集分析在線工具:
MBROLE: http://csbg.cnb.csic.es/mbrole2/
MetaboAnalyst:
https://www.metaboanalyst.ca/