先寫簡略版,以后再詳細寫。
1. 對輸入結構進行預處理(refine)
$> relax.default.linuxgccrelease -in:file:s input_files/from_rcsb/1qys.pdb @flag_input_relax
flag_input_relax:
-nstruct 2 -relax:constrain_relax_to_start_coords -relax:ramp_constraints false -ex1 -ex2 -use_input_sc -flip_HNQ -no_optH false
2. local dock
執行局部對接之前應手動把受體和配體放到一個pdb文件中,用不同的鏈標注(例如A,B),相距~10A,並且要有口袋的先驗知識,把受體配體按照先驗知識對好朝向。
使用以下兩個option控制局部對接:
-partners A_B -dock_pert 3 8
當受體鏈和配體鏈同時有多條時,例如AB,LH,則相應的改變option:
-partners LH_AB
運行docking_protocol命令:
$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_local_docking
flag_local_docking (最好-nstruct設置在500及以上):
-in:file:s input_files/col_complex.pdb -in:file:native input_files/1v74.pdb -unboundrot input_files/col_complex.pdb -nstruct 500 -partners A_B -dock_pert 3 8 -ex1 -ex2aro -out:path:all output_files/local_dock -out:suffix _local_dock
3. 對得到的對接結果進行local refine
得到結果后,對結果進行relax前,先用docking_protocol的local refine對蛋白界面氨基酸進行優化
相對於local dock 的flag文件,local refine只有下面這兩個選項不同:
-docking_local_refine
-use_input_sc
運行local refine命令:
$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_local_refine
flag_local_refine:
-in:file:s input_files/1v74.pdb -nstruct 1 -docking_local_refine -use_input_sc -ex1 -ex2aro -out:file:fullatom -out:path:all output_files -out:suffix _local_refine
運行完local refine后,就可以使用relax對對接結果進行優化處理了,命令如第一步使用relax預處理。
4. global dock
global dock適用於沒有蛋白相互作用的先驗知識,不知道結合位點,基本原理是對受體和配體均隨即取樣,相對於local dock來說,盲目性較大,運行時間也較長。
如下三個參數定義受體與配體的隨機取樣:
-spin -randomize1 -randomize2
-randomize1 表示對受體(蛋白1)進行隨機取樣, -randomize2 表示對配體(蛋白2)進行隨機取樣.
global dock的運行命令如下:
$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_global_docking
其中,flag_global_docking:
-in:file:s input_files/col_complex.pdb -in:file:native input_files/1v74.pdb -unboundrot input_files/col_complex.pdb -nstruct 1 -partners A_B -dock_pert 3 8 -spin -randomize1 -randomize2 -ex1 -ex2aro -out:path:all output_files -out:suffix _global_dock
相對於local dock,主要是上面提到的三個參數的變化,因global dock的隨機性較強,為達到收斂的效果,建議設置-nstruct 10000-100000。
5. Docking flexible proteins
之前提到的蛋白對接,蛋白的骨架都是固定的,對於柔性蛋白對接,rosetta采用的是使用centroid模式對受體和配體進行構象采樣,以受體或配體的構象集(ensemble)作為對接的輸入,至於蛋白的構象集,可以使用非限制性的relax來實現,因為relax本身就是一個對蛋白結構進行采樣(sample)程序。
首先,在做柔性對接前,我們要按以下格式分別准備受體及配體的構象列表,名詞為xxx_ensemblelist,這個列表類似於蛋白列表輸入:
xxx_ensemblelist:
input_files/COL_D_ensemble/COL_D_0001.pdb input_files/COL_D_ensemble/COL_D_0002.pdb input_files/COL_D_ensemble/COL_D_0003.pdb
分別准備好兩個列表后,使用 -ensemble1 和 -ensemble2 兩個參數,將pdb列表導入到程序中:
-ensemble1 COL_D_ensemblelist
-ensemble2 IMM_D_ensemblelist
在運行dock之前,我們首先需要對兩蛋白集進行prepacking,此步用於對兩蛋白進行處理,方便下一步dock的進行:
$> $ROSETTA3/main/source/bin/docking_prepack_protocol.linuxgccrelease @flag_ensemble_prepack
flag_ensemble_prepack:
-in:file:s input_files/col_complex.pdb -in:file:native input_files/1v74.pdb -unboundrot input_files/col_complex.pdb -nstruct 1 -partners A_B -ensemble1 COL_D_ensemblelist -ensemble2 IMM_D_ensemblelist -ex1 -ex2aro -out:path:all output_files -out:suffix _ensemble_prepack
prepack運行完畢,xxx_ensemblelist會被重新編輯,更改后的格式如下:
input_files/COL_D_ensemble/COL_D_0001.pdb.ppk input_files/COL_D_ensemble/COL_D_0002.pdb.ppk input_files/COL_D_ensemble/COL_D_0003.pdb.ppk 0.77058 0 1.00377 -93.3588 -94.2715 -93.9065
prepack運行后,就可以執行柔性對接了,對接命令為:
$> $ROSETTA3/main/source/bin/docking_protocol.linuxgccrelease @flag_ensemble_docking
flag_ensemble_docking:
-in:file:s input_files/col_complex.pdb -in:file:native input_files/1v74.pdb -unboundrot input_files/col_complex.pdb -nstruct 1 -partners A_B -dock_pert 3 8 -ensemble1 COL_D_ensemblelist -ensemble2 IMM_D_ensemblelist -ex1 -ex2aro -out:path:all output_files -out:suffix _ensemble_dock
柔性對接的結果好壞取決於構象取樣的多少,同時,伴隨着構象數增多,程序運行時間也會變長,為保證效果,推薦-nstruct設置大於5000.
6. Symmetric docking
7. 對接結構分析
典型的對接結果的score.sc如下所示:
SEQUENCE: SCORE: total_score rms Fnat I_sc Irms cen_dock_ens_conf cen_rms conf_num1 conf_num2 conf_score dock_ens_conf1 dock_ens_conf2 dslf_ca_dih dslf_cs_ang dslf_ss_dih dslf_ss_dst fa_atr fa_dun fa_elec fa_pair fa_rep fa_sol hbond_bb_sc hbond_lr_bb hbond_sc hbond_sr_bb interchain_contact interchain_env interchain_pair interchain_vdw st_rmsd description SCORE: -202.141 13.143 0.061 -3.086 5.015 -1.004 14.583 1.000 1.000 -25.732 -93.359 -83.050 0.000 0.000 0.000 0.000 -326.487 12.899 -3.158 -8.467 8.982 139.078 -3.968 -4.390 -2.692 -13.937 -20.000 -23.791 -2.002 0.357 7.729 col_complex_ensemble_dock_0001
其中,我們在關注total_score的同時,應該更多的關注I_sc,這一項描述的是蛋白界面相互作用得分(interface score,-2~-10),而且I_sc僅限於體系內比較,對於不同體系的蛋白,I_sc沒有比較意義。