PEAKS|NovoHMM|Nover|DeepNovo|MAYUPercolator|UniprotKB|Swiss-prot|Mascot|SEQUEST|X!Tandem|pFind|MaxQuant|Msconvert|PEPMASS|LC|


 

質譜儀:

質譜分析法是先將大分子電離為帶電粒子,按質核比分離,由質譜儀識別電信號得到質譜圖。

 

 

 

Top-down直接得到結果是蛋白。

 

 

 

Bottom down使用shutgun方法得到結果是肽段。

 

 

 

由蛋白質混合物打斷為肽段混合物,按特定時間分離為LC

 

 

 

初次得到的譜圖為一級譜,一級譜是串聯質譜,其中一個峰一個肽段。選出一個峰作為二級譜的原料,選出母離子(母離子就是整個肽段 PEPMASS)並打斷送入質譜儀,二級譜是一張圖中的一個肽段。除此之外還可以做更多等級的圖譜,tandem mass spectrometry),二級譜圖用於核心定性。利用蛋白酶的對在不同理化條件下產生不同切點的性質進行酶切,一般用一種酶切,有時候為了比對用兩種。其中,子離子與肽段的關系:子離子構成肽段,即子離子的構造是“羧基----離子---氨基”式組合。當AA一個個掉掉下來之后,測量得到b+y成對數據,即peptide fragment

 

質譜分析方法有從頭分析法和數據庫搜索匹配法,常用數據庫法,即實驗譜圖在已知肽段理論圖譜數據庫中找匹配。

 

 

數據處理流程:

 

因為不同質譜儀產出不同格式,所以要對數據進行格式轉換。Msconvert用於質譜轉換用於預處理,可以降噪音,母離子矯正和輸出規范化數據。

 

 

 

 

可以選擇以下搜索引擎,Mascot的鑒定效果好;SEQUEST是傳統的工具,不易學習和升級但是免費開源;X!Tandem可隨需改動;pFind由小團隊制作,但是靈敏度好;MaxQuant可同時產出定性和定量數據,使用方便,但覆蓋率低。不同軟件結果有不同,最好比對后選擇一種。

 

可以選擇數據庫,Uniprot中的UniprotKB&Swiss-prot高質量,低冗余而且是人工的專家確認;neXtprot存儲有關人類蛋白質數據,並有與實驗證據相聯系;IPI的穩定性比較差;NCBI中的RefSeq&nr是常見數據庫直接加和,所以該數據庫冗余量大,噪音非常大。

 

搜索引擎參數設定

 

蛋白質的鑒定和質檢:

基於數據庫法:

基於圖譜數據庫法的質檢主要關注假陽性FDR false discover rate,因為從譜圖到肽段到蛋白誤差逐漸放大。如圖,在某一圖譜總錯誤導致一個蛋白錯誤。所以在譜圖階段就應該質檢。原始數據中連續y連續b是好的。

 

 

 

先將蛋白質序列切成肽段序列,之后按照肽段分子排序,確定一個長度標准作為可鑒定出來的肽段,然后保留可鑒定長度的肽段。根據這些肽段找在數據庫中候選圖譜,組成理論圖譜基於打分函數(Xcorr & cn第一差距與第二差距)的得分判斷圖譜的可信度。

可基於正偽序列庫方法使用Percolator做質量控制,因為理論圖譜是正確序列和錯誤序列的集合,而偽庫就是錯誤序列的集合,其補集是正取序列。如此做減法,得到圖譜的線性模型或曲線模型,變成分類問題,以此找到正取的那部分。

 

 

 

此時存在共享肽段存在蛋白推導的困難,可以使用簡約組裝蛋白法。簡約組裝蛋白是選擇最多信息承載的最少蛋白組合而成的蛋白組。常用MAYU法。

 

 

 

基於從頭預測法: 

從頭測序預測方法是每個AA都算一遍,此方法可產生新蛋白,有PEAKSNovoHMM常用Nover方法,因其速度快,DeepNovo是深度學習方法。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM