【蛋白質基因組】Proteogenomics方法介紹及分析思路


概念

利用蛋白質組學數據,結合基因組數據(DNA)、轉錄組數據(RNA)來研究基因組注釋問題,被稱為蛋白質基因組學。“蛋白質基因組學”一詞由Jaffe 等於2004 年首次提出,作者采用串聯質譜數據匹配DNA翻譯得到氨基酸序列的方法,在僅有810 kb 大小的細菌基因組上直接鑒定開放閱讀框(open reading frame,ORF),驗證並補充、修訂了約10%的ORF。后來這種質譜數據結合DNA 和RNA 數據的分析方法被應用到注釋病毒基因組、原核生物基因組以及真核生物基因組。

本來只是利用蛋白質組的質譜數據完善基因組注釋的方法,近年來卻因為“精准醫療”帶火了。各種癌症利用這一方法砸錢發了一篇又一篇的CNS文章。

想更多了解,看綜述文章:
Proteogenomics: concepts, applications, and computational strategies
Clinical Potential of Mass Spectrometry-Based Proteogenomics
Proteogenomics: From Next-Generation Sequencing (NGS) and Mass Spectrometry-Based Proteomics to Precision Medicine
Methods, Tools and Current Perspectives in Proteogenomics

image.png
image.png

技術背景

不討論精准醫療方面的利用(聚焦於突變位點的研究),重點談論蛋白質基因組中對基因組重注釋的信息分析方法。

目前,基於質譜技術的蛋白組學對於研究生物體所有蛋白質在時間、空間的表達作出了重要的貢獻。與核酸測序技術不同的是,蛋白組技術並不能一個一個氨基酸檢測出來,而是通過質譜圖與理論的蛋白序列來進行匹配。然而,這個技術必須建立這樣的假設上:

  • 1)該物種基因組被完全測序且的絕大多數基因注釋都比較完善。
  • 2)公共數據庫含有較為完整的蛋白序列。
    然而,目前並不是所有基因的注釋都十分清楚,如氨基酸突變、新的蛋白編碼位點和可變剪切。

蛋白質基因組學技術(Proteogenomics)旨在基於蛋白質譜數據,結合基因組和轉錄組的注釋信息,在蛋白層次上挖掘、驗證:

    1. 新的蛋白編碼區域;
    1. 新的轉錄本;
    1. 氨基酸突變事件。
      這些信息在物種基因組注釋信息、提供基因模型表達證據、完善物種蛋白組序列數據庫上有重要意義。

分析方法和思路

利用蛋白基因組技術對物種基因組進行重注釋,其中最重要的一環為氨基酸特征序列數據庫的構建。“ 好”的構庫方法能夠保證后續能夠驗證到盡可能多的有效序列,同時不因數據庫尺寸“過度膨脹”導致太多假陽性驗證結果。

  1. 首先,需要對相應物種(某些組織)進行一定深度的轉錄組測序,然后基於基因組參考序列,比對原始數據並組裝獲取編碼轉錄本、LncRNA、可變剪切位點、SNV等信息。利用上述一種或多種信息根據一定規則構建自定義的特征列數據庫。通常情況下,推薦使用與蛋白質組實驗相同樣品進行轉錄組數據的采集。某些情況下,也可從已發表文獻或公共數據庫收集同一物種轉錄組數據輔助構庫。

  2. 接着,針對該物種,獲取蛋白表達數據,一方面可以利用質譜進行蛋白組學分析,另外一方面,可以從已發表數據獲取,例如PRIDE,PeptideAtlas等。而譜圖鑒定引擎將采集到的質譜數據與之前構建的數據庫中的肽段進行肽譜匹配打分。

  3. 不同於常規蛋白鑒定質控過程,新特征序列數據庫存在大量的冗余和隨機序列。 因此需要更為嚴格的質控標准和驗證方法才能保證鑒定到的新序列足夠可信。

  4. 對鑒定好的新肽段進行篩選分類,統計不同事件的數目。進行人工檢視輔助驗證各事件的可靠性。最后完成事件的基因組定位及數據可視化展示。

輸入

基因組信息:

  1. 物種的基因組全序列:genome.fasta

  2. 基因注釋文件:gene.gff

轉錄組數據:

  1. 測序平台:Highseq2000, 4000, X Ten

  2. 下機原始數據:.fastq文件

  3. 測序量:>2.5G/樣品 (二倍體)

蛋白組數據:

  1. 樣品組織類型:與轉錄組配對

  2. 數據量:>200,000張圖譜

  3. 質譜數據類型:iTRAQ/TMT,Label-free

  4. 質譜儀器:高分辨率質譜儀(qTOF, Orbitraq)

輸出

1)經典蛋白鑒定

2)新基因鑒定

3) 新轉錄本鑒定

4)SAV鑒定

Ref:https://www.genebang.com/pl/details/vy1E9y
http://www.doc88.com/p-3167460031564.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM