蛋白質組學實驗設計、質控與分析


1. 實驗設計與技術路線

(1) 常用流程

流程 說明
1.材料收集 細胞、細胞上清、組織、血漿、血清、腦脊液、外泌體、尿液......
2.定量技術 蛋白組:iTRAQ/TMT、LabelFree、SILAC、修飾;代謝組:靶向、非靶
3.數據驗證 蛋白組:PRM、WB、ELISA;代謝組:MRM
4.深入研究 臨床標志物、生理病理機制、葯效機制、中醫理論、葯物靶點......

(2) 樣品

樣品類型 Pool(混樣) Individual(單樣)
降低個體差異 不要求大樣本 要求大樣本
數據分析 低維,難以整合其他信息 多維多角度
可追溯性 不能重新定義組別 可根據所需重新定義組別
樣本量
成本

(3) iTRAQ/TMT項目設計
體外等重同位素標記定量技術,可同時比較多個樣本之間的蛋白表達量差異(通常10個樣本以下)。
基本原則

  • 適用較廣,但樣本間需要較好的平行性,不適合進行不同物種樣本間比較,如牛、羊、豬之間的比較;也不適合一些差異較大的IP樣品的比較。
  • 一般差異比較樣本組用同一個試劑盒標記;
  • 建議3個生物學重復;對於臨床樣本、小鼠等動物樣本、植物樣本等,每個生物學重復建議來自多個生物個體的重復;
  • 多個試劑盒項目設計時,可加入內標(IS),內標通常是所有樣本等量混合的樣本。

(4) Labelfree項目設計
Labelfree是通過比較肽段母離子質譜峰強度,分析不同來源樣品蛋白的表達量差異。該技術無需昂貴的同位素標記做內標。
基本原則

  • 適用於各類型生物樣本;尤其是樣本量較少或差異非常大的樣品,如細胞上清、亞細胞成分、IP樣品等的分析;
  • 對於組間差異大的樣品,可采用iBAQ算法(MaxQuant)來反映一個樣品內不同蛋白間的相對豐度,可進行不同物種樣品間的比較,如牛、羊、豬之間的比較;
  • 適合多組分析、后期差異比較組可能會改變的實驗設計;
  • 建議3個生物學重復;對於臨床樣本、小鼠等動物樣本、植物樣本等,每個生物學重復建議來自多個生物個體的重復。

(5)DIA項目設計
DIA是數據非依賴性采集定量技術,它將質譜整個全掃描范圍分為若干個窗口,高速循環地對每個窗口中的所有離子進行選擇、碎裂及檢測,從而無遺漏、無差異地獲取樣本中所有離子的全部碎片信息。DIA無需指定目標肽段,掃描點數均勻,利用譜圖庫即可實現定性確證和定量離子篩選,並可實現數據回溯。
基本原則

  • 適用於各類型生物樣本;
  • 需要先進行library構建;
  • 適合多組分析、后期差異比較組可能會改變的實驗設計;
  • 建議獨立的大樣本分析。

(6)各定量技術比較
從數據采集模式來說,iTRAQ/TMT和Labelfree都是傳統的DDA掃描,即在每個掃描周期內,只采集豐度最高的10-20個母離子信號的子離子碎片,其他信號的子離子信息丟失,因此覆蓋率低、隨機性高、重復性相對低;DIA掃描則在每個掃描周期內,將質量區間設置為多個區段window,每次采集window內所有母離子信息及其碎片(掃描速度足夠快),因此具有高覆蓋度、高重復性的特點。

定量技術 iTRAQ/TMT Labelfree Labelfree分級 DIA
樣本數 少/多
樣品 一般pool pool/individual 一般pool 一般individual
樣品平行性 平行 平行/不平行 平行/不平行 平行/不平行
數據量深度
PRM驗證對接性
建庫
成本 較高 較高
拓展性 是(可根據library重新分析)
采集模式 DDA DDA DDA DIA

(7)搜庫軟件

流程回顧:
蛋白質酶切為肽段,經過色譜分離進入質譜儀,得到質譜實際譜圖,利用搜庫軟件與理論譜圖進行匹配打分,對肽段和蛋白進行鑒定、定量和下游數據分析。

  • Mascot
    特點:收費;基於隨機匹配打分算法;整合FDR閾值和Percolator算法;質譜數據檢索的黃金標准。
  • MaxQuant
    特點:免費不開源;優勢在labelfree,RT校正,Match between runs提高鑒定數;配套的后處理工具Perseus。
  • Spectronaut
    特點:收費;相對其他DIA軟件,准確性高、靈敏度高、速度快;實現超過1000個DIA原始文件同時分析,極高譜圖解析率,數據校正平均峰面積CV<10%;蛋白FDR、肽段FDR和CScore三重標准。

2. 質量控制

(1)色譜質控

  • 色譜的峰形,決定定量准不准
    對稱?拖尾?
  • 色譜的數據點,決定定量准不准
    峰曲線上點多?少?
  • 色譜的穩定性,決定定量准不准
    RT是否偏移?使用iRT同位素內參校正色譜偏移
  • 色譜的分離度,決定質譜的采集效率
    (2)質量控制
  • 基礎狀態考察
    牛血清白蛋白(BSA):考察質量偏移、洗脫時間、峰寬、信號響應等;
    細胞樣品:考察組學能力,如負責樣品蛋白和肽段數目鑒定能力。
  • 復雜樣本鑒定重現性
    三次重復鑒定的肽段DDA在60%以上,DIA在90%以上;
    三次重復鑒定的蛋白DDA在70%以上,DIA在90%以上;
  • QC樣本
    一般是將所有樣本等量混合成QC樣本。前后QC,中間每10個樣加一個QC。
    統計分析QC樣本的CV分布、聚類、相關性分析、PCA得分、質譜穩定性。
    (3)質控目標

  • 鑒定數目多,覆蓋率高。

  • 鑒定重現性高,穩定性好,尤其是大樣本的檢測。

  • 定量准確性高。

3. 下游分析

進行蛋白質組學的研究,可從以下角度來分析:

  • 哪些蛋白質?

  • 豐度如何?

  • 有何功能?

  • 在哪里作用?

  • 是否或如何互作?

  • 結構?
    鑒定層面就不再贅述,只補充下搜庫的數據庫選擇。一是綜合性蛋白數據庫,如NCBI、Uniprot、Ensembl等;二是特定物種的蛋白庫,如擬南芥(TAIR)、水稻(RAPDB)、家蠶(silkdb)等;三是針對非模式生物,由已測序結果翻譯而來的蛋白序列數據。
    (1)定量層面

  • 定量數據概括
    a. 表達量層次聚類熱圖:
    在相似性的基礎上對數據分組、歸類。一般組內的數據模式相似性較高,組間相似性較低。
    b. 樣品組間表達譜相關性分析:
    樣本相關性熱圖。
    c. PCA 分析:
    多個變量綜合定量比較考察。
    對高維數據降維,減少復雜性,對樣本進行分類及預測,易於解釋,分離信號和噪音,數據可視化。

  • 趨勢聚類分析
    即將蛋白根據表達趨勢進行歸類。趨勢聚類后,可以結合層次聚類、共表達網絡分析、功能分類、信號通路分類或染色體分析等方法進行更深入的挖掘,適合最佳時間、最佳濃度、最佳溫度等的選擇。

  • 統計學分析
    差異蛋白篩選:

設計 實驗設計 重復設計 統計學方法
兩組間比較 實驗 vs 對照 >=3 T-test
❤️ Significance A/B
多組比較 梯度1 vs 梯度2 vs 梯度3... >=3 One-way Anova
case*2 vs control*2 >=3 Two-way Anova

(2)功能層面

  • 亞細胞定位預測
    生物體內的蛋白質必須要運輸到細胞的特定位置才能發揮生物學功能。研究未知蛋白生物學功能的第一步通常是獲得蛋白亞細胞定位信息。
    傳統的電子顯微法、熒光顯微法等實驗驗證方法進行亞細胞定位,結果准確但費時費力,因此可通過機器學習算法實現大規模蛋白的亞細胞定位預測。
    在線工具:
    CELL:http://cello.life.nctu.edu.tw/

  • 功能分析
    根據相似性原理,具有相似序列的蛋白也可能具有相似的功能,因此將blast所得的相似蛋白的功能信息轉嫁到目標蛋白上,可輔助對於目標蛋白尤其是研究程度不足的物種的目標蛋白的功能注釋。
    GO(Gene Ontology)基因功能標准化詞匯術語,三大本體BP,CC,MF。
    BlastGO大規模注釋GO。
    注釋是一個評判打分的過程,這個打分系統會綜合考量目標序列和比對序列的相似性、GO條目來源的可靠度以及GO有向無環圖的結構,只有滿足預設分數的GO term才會被注釋給目標蛋白序列。
    保守motif預測:通過InterProscan搜索EBI數據庫中與目標蛋白匹配的保守基序(motif),並將motif相關的功能信息注釋給目標蛋白序列。
    在線工具:Motif-x:http://motif-x.med.harvard.edu/

  • 通路分析
    KEGG Pathway共7大類。介紹略
    多通路整合——>發現分子調控機制。

  • 蛋白互作網絡
    在生物體中,蛋白質並非孤立存在的,其功能的行使必須借助於其他蛋白質的調節和介導。這種調節或介導作用的實現首先要求蛋白質之間有結合作用或相互作用。
    蛋白質互作網絡對於揭示蛋白功能具有重要意義。例如,高度聚集的蛋白質可能具有相同或相似的功能;連接度高的蛋白質可能是影響整個系統代謝或信號轉導途徑的關鍵點。
    分析工具:IntAct、MINT、String、Cytoscape......
    術語:edge、node、cluster、degree、module.......


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM