1.實驗及質控
(1)項目流程
代謝組學分析的特點:
- 流程長;
- 樣品量大,項目周期長;
- 個體差異大;
- 設備不穩定性;
- 樣品復雜,基質效應顯著。
所以,質量控制是代謝組學研究基礎。
項目流程
樣本制備——質譜儀分析——數據預處理——定量及統計分析——定性分析——生信及后續分析
(2)非靶代謝質控
質譜儀信號波動使非靶代謝信號隨時間漂移。
原因:
- 電噴霧噴針老化
- 儀器設備入口毛細管污染
- 前級離子導引部件污染
- 檢測器老化
- 質量分析器污染
信號隨時間漂移或中途設備維護會嚴重影響多元統計分析效果,如PCA中樣品分布不均勻,存在異常值。從而引起后續分析,如篩選生物標志物失敗。
對非靶代謝信號時間漂移的重新校准,改善數據分析效果:
- 添加QC樣本(前后+每隔10樣)。
- 使用MetNormalizer校准(基於支持向量回歸算法)。
(3)靶向代謝質控
不同出峰時間,對應不同的基質效應。
基質效應可能使絕對定量不准確。
無同位素內標:分析物與內標物基質效應不同;
有同位素內標:保留時間及表面活性的微小差別,仍會使分析物與內標物響應不同。
定量准確性質控:
加標回收實驗:理論添加值約等於實測增加值(80-120%)。
設備靈敏度質控:
樣品平均混合質控:設備靈敏度在合理范圍內,未檢出確實來源於內源性分析物濃度的下降。
(4)代謝組全流程質控
樣本制備:
- 樣本收樣及存儲標准化管理
- 高效有序的樣品預處理流程
質譜儀分析:
- 非靶信號漂移QC實驗方案
- 靶向雙QC實驗方案
數據預處理:
- 高效的數據校准方法
- Hotelling's T2篩出潛在異常點,分情況小心移除
定量及統計分析:
- 多元統計及單變量分析結合篩選生物標志物
- 加標回收實驗確保定量結果准確
2.數據分析挖掘
(1)代謝組分類回顧
非靶:進行大規模、系統性研究,用於前期數據挖掘與篩選。
- 非靶組:通常所說的非靶代謝組學,指氨基酸類、核苷酸類、能量代謝、維生素類、神經遞質類等及其衍生物。
- 脂質組:甘油脂類、磷酯類、鞘脂類、脂肪酸類、固醇類等。
靶向:驗證非靶向分析的結果,對目標代謝物進行選擇性、特異性定量與絕對定量。
非靶和靶向的樣本制備、色譜體系、代謝物鑒定模式均不同。
(2)數據預處理
①數據完整性檢查
- 保留通道值大於一半的數據
- 缺失值填充(10%以上填充)
-- 刪除包含缺失值的變量
-- 對缺失值進行估計:KNN/PPCA/BPCA/SVD Impute
-- 固定值填充:最小值的一半
-- 按列填充:均值/中位數/最小值 - 過濾QC RSD>30%
②數據標准化
- 標准化(后面待續....)
- 歸一化
(3)定量層面挖掘
①統計分析
- 單變量
- 多變量
②聚類分析
③共表達網絡
(4)功能層面挖掘
通路分析
