ROSETTA使用技巧隨筆--蛋白蛋白對接


先寫簡略版,以后再詳細寫。

1. 對輸入結構進行預處理(refine)

$> relax.default.linuxgccrelease -in:file:s input_files/from_rcsb/1qys.pdb @flag_input_relax  

flag_input_relax:

-nstruct 2

-relax:constrain_relax_to_start_coords
-relax:ramp_constraints false

-ex1
-ex2

-use_input_sc
-flip_HNQ
-no_optH false

2. local dock

執行局部對接之前應手動把受體和配體放到一個pdb文件中,用不同的鏈標注(例如A,B),相距~10A,並且要有口袋的先驗知識,把受體配體按照先驗知識對好朝向。

使用以下兩個option控制局部對接:

-partners A_B
-dock_pert 3 8

當受體鏈和配體鏈同時有多條時,例如AB,LH,則相應的改變option:

-partners LH_AB

運行docking_protocol命令:

$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_local_docking

flag_local_docking (最好-nstruct設置在500及以上):

-in:file:s input_files/col_complex.pdb
-in:file:native input_files/1v74.pdb
-unboundrot input_files/col_complex.pdb

-nstruct 500

-partners A_B
-dock_pert 3 8

-ex1
-ex2aro

-out:path:all output_files/local_dock
-out:suffix _local_dock

3. 對得到的對接結果進行local refine

得到結果后,對結果進行relax前,先用docking_protocol的local refine對蛋白界面氨基酸進行優化

相對於local dock 的flag文件,local refine只有下面這兩個選項不同:

-docking_local_refine
-use_input_sc

運行local refine命令:

$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_local_refine

flag_local_refine:

-in:file:s input_files/1v74.pdb

-nstruct 1

-docking_local_refine
-use_input_sc

-ex1
-ex2aro

-out:file:fullatom
-out:path:all output_files
-out:suffix _local_refine

運行完local refine后,就可以使用relax對對接結果進行優化處理了,命令如第一步使用relax預處理。

4. global dock

global dock適用於沒有蛋白相互作用的先驗知識,不知道結合位點,基本原理是對受體和配體均隨即取樣,相對於local dock來說,盲目性較大,運行時間也較長。

如下三個參數定義受體與配體的隨機取樣:

-spin
-randomize1
-randomize2

 -randomize1 表示對受體(蛋白1)進行隨機取樣, -randomize2 表示對配體(蛋白2)進行隨機取樣.

global dock的運行命令如下:

$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_global_docking

其中,flag_global_docking:

-in:file:s input_files/col_complex.pdb
-in:file:native input_files/1v74.pdb
-unboundrot input_files/col_complex.pdb

-nstruct 1

-partners A_B
-dock_pert 3 8
-spin
-randomize1
-randomize2

-ex1
-ex2aro

-out:path:all output_files
-out:suffix _global_dock

相對於local dock,主要是上面提到的三個參數的變化,因global dock的隨機性較強,為達到收斂的效果,建議設置-nstruct 10000-100000

5. Docking flexible proteins

之前提到的蛋白對接,蛋白的骨架都是固定的,對於柔性蛋白對接,rosetta采用的是使用centroid模式對受體和配體進行構象采樣,以受體或配體的構象集(ensemble)作為對接的輸入,至於蛋白的構象集,可以使用非限制性的relax來實現,因為relax本身就是一個對蛋白結構進行采樣(sample)程序。

首先,在做柔性對接前,我們要按以下格式分別准備受體及配體的構象列表,名詞為xxx_ensemblelist,這個列表類似於蛋白列表輸入:

xxx_ensemblelist:

input_files/COL_D_ensemble/COL_D_0001.pdb
input_files/COL_D_ensemble/COL_D_0002.pdb
input_files/COL_D_ensemble/COL_D_0003.pdb

分別准備好兩個列表后,使用 -ensemble1 和 -ensemble2 兩個參數,將pdb列表導入到程序中:

-ensemble1 COL_D_ensemblelist
-ensemble2 IMM_D_ensemblelist

在運行dock之前,我們首先需要對兩蛋白集進行prepacking,此步用於對兩蛋白進行處理,方便下一步dock的進行:

$> $ROSETTA3/main/source/bin/docking_prepack_protocol.linuxgccrelease @flag_ensemble_prepack

flag_ensemble_prepack:

-in:file:s input_files/col_complex.pdb
-in:file:native input_files/1v74.pdb
-unboundrot input_files/col_complex.pdb

-nstruct 1

-partners A_B

-ensemble1 COL_D_ensemblelist
-ensemble2 IMM_D_ensemblelist

-ex1
-ex2aro

-out:path:all output_files
-out:suffix _ensemble_prepack

prepack運行完畢,xxx_ensemblelist會被重新編輯,更改后的格式如下:

input_files/COL_D_ensemble/COL_D_0001.pdb.ppk
input_files/COL_D_ensemble/COL_D_0002.pdb.ppk
input_files/COL_D_ensemble/COL_D_0003.pdb.ppk
0.77058
0
1.00377
-93.3588
-94.2715
-93.9065

prepack運行后,就可以執行柔性對接了,對接命令為:

$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_ensemble_docking

flag_ensemble_docking:

-in:file:s input_files/col_complex.pdb
-in:file:native input_files/1v74.pdb
-unboundrot input_files/col_complex.pdb

-nstruct 1

-partners A_B
-dock_pert 3 8

-ensemble1 COL_D_ensemblelist
-ensemble2 IMM_D_ensemblelist

-ex1
-ex2aro

-out:path:all output_files
-out:suffix _ensemble_dock

柔性對接的結果好壞取決於構象取樣的多少,同時,伴隨着構象數增多,程序運行時間也會變長,為保證效果,推薦-nstruct設置大於5000.

6. Symmetric docking

7. 對接結構分析

典型的對接結果的score.sc如下所示:

SEQUENCE: 
SCORE: total_score         rms        Fnat        I_sc        Irms cen_dock_ens_conf           cen_rms conf_num1 conf_num2 conf_score dock_ens_conf1 dock_ens_conf2 dslf_ca_dih dslf_cs_ang dslf_ss_dih dslf_ss_dst      fa_atr      fa_dun     fa_elec     fa_pair      fa_rep      fa_sol hbond_bb_sc hbond_lr_bb    hbond_sc hbond_sr_bb interchain_contact interchain_env interchain_pair interchain_vdw        st_rmsd description 
SCORE:    -202.141      13.143       0.061      -3.086       5.015            -1.004            14.583     1.000     1.000    -25.732        -93.359        -83.050       0.000       0.000       0.000       0.000    -326.487      12.899      -3.158      -8.467       8.982     139.078      -3.968      -4.390      -2.692     -13.937            -20.000        -23.791          -2.002          0.357          7.729 col_complex_ensemble_dock_0001

其中,我們在關注total_score的同時,應該更多的關注I_sc,這一項描述的是蛋白界面相互作用得分(interface score,-2~-10),而且I_sc僅限於體系內比較,對於不同體系的蛋白,I_sc沒有比較意義。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM