生物醫學大數據-蛋白質定量
現今肽段定量效率存在巨大差異。比如相同質量蛋白質,但是肽段和蛋白信號不均一,在物理條件一致時,僅有70%的重復率,並且當重復次數變多時,overlapping在變少。
無標定量法
方法一是針對二級色譜的譜圖計數,即統計二級色譜的數量,數量越多則蛋白豐度越高,但相同豐度蛋白也有不同的二級色譜數,所以算法目的是減少噪音。
方法二是針對一級色譜的離子流色譜峰XIC,即每個肽段的離子流色譜峰,可以取同一個肽段不同時間點上的信號強度,連接成峰,通過求該曲線的曲線下面積獲取曲線信息,通過采集同一個肽段的所有信息利用交叉搜索策略,相互比對后填補丟失量:
在交叉搜索策略中,使用RT對對齊,分別是全局比對和局部比對,最后為了克服系統誤差而進行歸一化處理,比如max歸一化是指將一組數據中的最大值定為1,每組都是同樣標准。可以基於譜圖數據庫找到該二級色譜對應的序列,也可以統一過一級圖譜的特征搜索AMT數據庫。
基因組與蛋白質在實驗技術上的差異,基因組測序重復性好,但是蛋白質質譜實驗可重復性低。
腳本串接software無標定量軟件,常用的XIC無標定量軟件有:
LFQuant 可以對譜圖數據進行多級過濾,保留時間對齊和有較好的准確性評估和重復性評估
譜圖計數速度快但是精度低和動態范圍小,而XIC主要采用搜庫能省時且准確,但特征比對就比較耗時。
有標定量是采用穩定同位素標記方法:
有標定量分為母離子和子離子定量:
母離子標記software:
Eg:SILVER
子離子定量軟件:
無標定量的試驗成本低,適用不同平台數據相比較的情況,較有標定量動態范圍大。有標定量受到質譜平台影響小,較為准確。
相對定量比絕對定量誤差要小,絕對定量的實驗方法是SRM結合內標肽段,常用數據庫:
計算方法是iBAQ或APEX等,其中APEX准確性較好。
差異蛋白篩選:
先對蛋白質進行定量,然后缺失值差補,再使用統計學檢驗方法進行統計學檢驗,然后使用統計學工具繪制火山圖,最后得到差異蛋白列表。常用的Software:
注意:蛋白質多缺失值需要至少三次重復,不濫用p-value,關於生物統計學問題可查看nature生物統計專題。
定量軟件:MaxQuant&PANDA
C-HPP可將不同實驗室定量結果整合:
高豐度蛋白作用於結構,低豐度作用於調節