增強采樣軟件PLUMED的安裝與使用


技術背景

增強采樣(Enhanced Sampling)是一種在分子動力學模擬中常用的技術,其作用是幫助我們更加快速的在時間軸上找到盡可能多的體系結構及其對應的能量。比如一個氫氣的燃燒反應,在中間過程中會產生眾多的反應產物,但是我們光從結果來看的話,就是從\(H_2\)\(O_2\),經過燃燒以后變成了\(H_2O\),那么中間的過程就被我們全部忽略了。實際上化學反應是一個整體的過程,是非常復雜的,如果要控制一個化學反應的過程,或者制備某個中間態的產物,或者需要提升最終預期產物的占比,我們不得不考慮整個化學反應的路徑。

由於分子動力學模擬是基於牛頓力學的,因此中間發生的位移和碰撞我們都認為是連續的過程,但是為了在時間軸上更快的讀取數據,我們不能無限制的對時間進行分割,只能通過對時間進行采樣來獲得一個近似的過程。最典型的就是均勻采樣,比如每隔10ps采一個樣本點。但是這種方法在保障計算效率的前提下,很容易忽略了中間過程中出現時間極其短暫的一個體系狀態。因此就需要使用到增強抽樣的方法,對於高簡並度的狀態,我們降低其被采樣的概率,而對於低簡並度的狀態,我們提升其被采到的概率。常見的方法有:Meta Dynamics、VES和ITS等。這里我們探索一下分子動力學模擬軟件PLUMED的安裝,該軟件已經集成了很大一部分的CV和增強采樣的方法。

PLUMED的下載與安裝

首先訪問其官方下載網站找到一個合適的版本進行下載,比如這里我是直接下載的最新的版本:

下載完成后可以用tar -xvf plumed-2.7.1.tgz指令來進行解壓縮,可以看到解壓后的目錄如下所示:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed$ ll
總用量 103736
drwxrwxr-x  3 dechin dechin      4096 7月  12 09:21 ./
drwxrwxr-x 10 dechin dechin      4096 7月  12 09:20 ../
drwxrwxr-x 18 dechin dechin      4096 4月  16 14:48 plumed-2.7.1/
-rw-rw-r--  1 dechin dechin 106210796 7月  12 09:21 plumed-2.7.1.tgz
(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed$ cd plumed-2.7.1/
(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/plumed-2.7.1$ ll
總用量 504
drwxrwxr-x 18 dechin dechin   4096 4月  16 14:48 ./
drwxrwxr-x  3 dechin dechin   4096 7月  12 09:21 ../
drwxrwxr-x  6 dechin dechin   4096 4月  16 14:48 astyle/
-rw-rw-r--  1 dechin dechin     71 4月  16 14:48 .astyle.options
drwxrwxr-x  2 dechin dechin   4096 4月  16 14:48 CHANGES/
-rw-rw-r--  1 dechin dechin     94 4月  16 14:48 .codecov.yml
drwxrwxr-x  4 dechin dechin   4096 4月  16 14:48 conda/
-rwxrwxr-x  1 dechin dechin 323087 4月  16 14:48 configure*
-rw-rw-r--  1 dechin dechin  43692 4月  16 14:48 configure.ac
-rw-rw-r--  1 dechin dechin   7639 4月  16 14:48 COPYING.LESSER
drwxrwxr-x  2 dechin dechin   4096 4月  16 14:48 developer-doc/
drwxrwxr-x  2 dechin dechin   4096 4月  16 14:48 docker/
drwxrwxr-x  3 dechin dechin   4096 4月  16 14:48 .github/
-rw-rw-r--  1 dechin dechin    179 4月  16 14:48 .gitignore
-rw-rw-r--  1 dechin dechin    245 4月  16 14:48 .lgtm.yml
drwxrwxr-x  2 dechin dechin   4096 4月  16 14:48 macports/
-rw-rw-r--  1 dechin dechin   2485 4月  16 14:48 Makefile
-rw-rw-r--  1 dechin dechin   1200 4月  16 14:48 Makefile.conf.in
drwxrwxr-x  7 dechin dechin   4096 4月  16 14:48 patches/
-rw-rw-r--  1 dechin dechin    527 4月  16 14:48 PEOPLE
drwxrwxr-x  3 dechin dechin   4096 4月  16 14:48 python/
-rw-rw-r--  1 dechin dechin   8146 4月  16 14:48 README.md
drwxrwxr-x 26 dechin dechin   4096 4月  16 14:48 regtest/
-rwxrwxr-x  1 dechin dechin   5397 4月  16 14:48 release.sh*
drwxrwxr-x  2 dechin dechin   4096 4月  16 14:48 scripts/
-rw-rw-r--  1 dechin dechin    319 4月  16 14:48 sourceme.sh.in
drwxrwxr-x 45 dechin dechin   4096 4月  16 14:48 src/
-rw-rw-r--  1 dechin dechin      0 4月  16 14:48 stamp-h.in
drwxrwxr-x  6 dechin dechin   4096 4月  16 14:48 test/
drwxrwxr-x  2 dechin dechin   4096 4月  16 14:48 .travis/
-rw-rw-r--  1 dechin dechin  10558 4月  16 14:48 .travis.yml
drwxrwxr-x  4 dechin dechin   4096 4月  16 14:48 user-doc/
-rw-rw-r--  1 dechin dechin    322 4月  16 14:48 VERSION
drwxrwxr-x  2 dechin dechin   4096 4月  16 14:48 vim/

直接在這個plumed-2.7.1(注意對應自己安裝的版本)目錄下執行如下的指令進行安裝:

$ ./configure --prefix=/usr/local
$ make -j 4
$ sudo make install

安裝驗證

安裝完成后,可以在命令行中直接使用plumed指令,可以用如下幫助指令,確認軟件是否被安裝成功:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples$ plumed help
Usage: plumed [options] [command] [command options]
  plumed [command] -h|--help: to print help for a specific command
Options:
  [help|-h|--help]          : to print this help
  [--is-installed]          : fails if plumed is not installed
  [--has-mpi]               : fails if plumed is running without MPI
  [--has-dlopen]            : fails if plumed is compiled without dlopen
  [--load LIB]              : loads a shared object (typically a plugin library)
  [--standalone-executable] : tells plumed not to look for commands implemented as scripts
Commands:
  plumed completion : dump a function usable for programmable completion
  plumed driver : analyze trajectories with plumed
  plumed driver-float : analyze trajectories with plumed (single precision version)
  plumed gen_example : construct an example for the manual that users can interact with
  plumed gentemplate : print out a template input for a particular action
  plumed info : provide informations about plumed
  plumed kt : print out the value of kT at a particular temperature
  plumed manual : print out a description of the keywords for an action in html
  plumed pathtools : print out a description of the keywords for an action in html
  plumed pdbrenumber : Modify atom numbers in a PDB, possibly using hybrid-36 coding
  plumed pesmd : Langevin dynamics on PLUMED energy landscape
  plumed simplemd : run lj code
  plumed sum_hills : sum the hills with  plumed
  plumed patch : patch an MD engine
  plumed vim2html : convert plumed input file to colored html using vim syntax
  plumed selector : create lists of serial atom numbers
  plumed config : inquire plumed about how it was configure
  plumed newcv : create a new collective variable from a template
  plumed mklib : compile a .cpp file into a shared library
  plumed partial_tempering : scale parameters in a gromacs topology to implement solute or partial tempering

簡單示例

使用plumed,需要有一個完整的反應路徑文件,這里我們可以用wget直接下載plumed倉庫中的示例軌跡文件:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples$ wget https://plumed.github.io/doc-v2.4/user-doc/html/tutorial-resources/trieste-1.tar.gz
--2021-07-12 10:18:18--  https://plumed.github.io/doc-v2.4/user-doc/html/tutorial-resources/trieste-1.tar.gz
正在解析主機 plumed.github.io (plumed.github.io)... ::1, 185.199.109.153, 185.199.108.153, ...
正在連接 plumed.github.io (plumed.github.io)|::1|:443... 失敗:拒絕連接。
正在連接 plumed.github.io (plumed.github.io)|185.199.109.153|:443... 已連接。
已發出 HTTP 請求,正在等待回應... 301 Moved Permanently
位置:https://www.plumed.org/doc-v2.4/user-doc/html/tutorial-resources/trieste-1.tar.gz [跟隨至新的 URL]
--2021-07-12 10:18:19--  https://www.plumed.org/doc-v2.4/user-doc/html/tutorial-resources/trieste-1.tar.gz
正在解析主機 www.plumed.org (www.plumed.org)... ::1, 185.199.109.153, 185.199.108.153, ...
正在連接 www.plumed.org (www.plumed.org)|::1|:443... 失敗:拒絕連接。
正在連接 www.plumed.org (www.plumed.org)|185.199.109.153|:443... 已連接。
已發出 HTTP 請求,正在等待回應... 200 OK
長度: 335374 (328K) [application/gzip]
正在保存至: “trieste-1.tar.gz”

trieste-1.tar.gz    100%[==================>] 327.51K  --.-KB/s    用時 0.04s 

2021-07-12 10:18:20 (8.02 MB/s) - 已保存 “trieste-1.tar.gz” [335374/335374])

同樣的執行解壓:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples$ ll
總用量 336
drwxrwxr-x 2 dechin dechin   4096 7月  12 10:18 ./
drwxrwxr-x 4 dechin dechin   4096 7月  12 09:38 ../
-rw-rw-r-- 1 dechin dechin 335374 11月 18  2020 trieste-1.tar.gz
(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples$ tar -xvf trieste-1.tar.gz 
trieste-1/
trieste-1/.solutions/
trieste-1/.solutions/ref-rna.pdb
trieste-1/.solutions/plumed-ex2c.dat
trieste-1/.solutions/plumed-ex2.dat
trieste-1/.solutions/plumed-ex2b.dat
trieste-1/.solutions/plumed-ex1b.dat
trieste-1/.solutions/plumed-ex1.dat
trieste-1/traj-broken.xtc
trieste-1/ref.pdb
trieste-1/traj-whole.xtc

解壓后可以在目錄下看到一個pdb的配置文件和兩個xtc的軌跡文件,這個是用gromacs生成的數據文件格式:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples/trieste-1$ ll
總用量 752
drwxr-xr-x 3 dechin dechin   4096 11月 18  2020 ./
drwxrwxr-x 3 dechin dechin   4096 7月  12 10:19 ../
-rw-r--r-- 1 dechin dechin 519979 11月 18  2020 ref.pdb
drwxr-xr-x 2 dechin dechin   4096 11月 18  2020 .solutions/
-rw-r--r-- 1 dechin dechin 117620 11月 18  2020 traj-broken.xtc
-rw-r--r-- 1 dechin dechin 116036 11月 18  2020 traj-whole.xtc

在具備了軌跡文件之后,就可以按照官方的文檔示例來編寫plumed.dat配置輸入文件,用於定義需要計算的內容,比如這里定義的是計算1號原子和2號原子之間的距離,並每10個step將其寫入到名為colvar的文件下:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples/trieste-1$ cat plumed.dat 
d1: DISTANCE ATOMS=1,2 
PRINT ARG=d1 FILE=colvar STRIDE=10

執行plumed指令得到的結果如下:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples/trieste-1$ plumed driver --mf_xtc traj-whole.xtc --plumed plumed.dat 

DRIVER: Found molfile format trajectory xtc with name traj-whole.xtc
PLUMED: PLUMED is starting
PLUMED: Version: 2.7.1 (git: Unknown) compiled on Jul 12 2021 at 09:24:30
PLUMED: Please cite these papers when using PLUMED [1][2]
PLUMED: For further information see the PLUMED web page at http://www.plumed.org
PLUMED: Root: /usr/local/lib/plumed
PLUMED: For installed feature, see /usr/local/lib/plumed/src/config/config.txt
PLUMED: Molecular dynamics engine: driver
PLUMED: Precision of reals: 8
PLUMED: Running over 1 node
PLUMED: Number of threads: 1
PLUMED: Cache line size: 512
PLUMED: Number of atoms: 6580
PLUMED: File suffix: 
PLUMED: FILE: plumed.dat
PLUMED: Action DISTANCE
PLUMED:   with label d1
PLUMED:   between atoms 1 2
PLUMED:   using periodic boundary conditions
PLUMED: Action PRINT
PLUMED:   with label @1
PLUMED:   with stride 10
PLUMED:   with arguments d1
PLUMED:   on file colvar
PLUMED:   with format  %f
PLUMED: END FILE: plumed.dat
PLUMED: Timestep: 1.000000
PLUMED: KbT has not been set by the MD engine
PLUMED: It should be set by hand where needed
PLUMED: Relevant bibliography:
PLUMED:   [1] The PLUMED consortium, Nat. Methods 16, 670 (2019)
PLUMED:   [2] Tribello, Bonomi, Branduardi, Camilloni, and Bussi, Comput. Phys. Commun. 185, 604 (2014)
PLUMED: Please read and cite where appropriate!
PLUMED: Finished setup
PLUMED:                                               Cycles        Total      Average      Minimum      Maximum
PLUMED:                                                    1     0.003111     0.003111     0.003111     0.003111
PLUMED: 1 Prepare dependencies                             5     0.000005     0.000001     0.000000     0.000003
PLUMED: 2 Sharing data                                     1     0.001410     0.001410     0.001410     0.001410
PLUMED: 3 Waiting for data                                 1     0.000022     0.000022     0.000022     0.000022
PLUMED: 4 Calculating (forward loop)                       1     0.000017     0.000017     0.000017     0.000017
PLUMED: 5 Applying (backward loop)                         1     0.000047     0.000047     0.000047     0.000047
PLUMED: 6 Update                                           1     0.000052     0.000052     0.000052     0.000052

在這個給定的軌跡文件中其實包含了5個step,但是由於我們設置了每10個step打印一次,因此最終存儲到colvar中的數據只有1個值:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples/trieste-1$ ll
總用量 760
drwxr-xr-x 3 dechin dechin   4096 7月  12 10:22 ./
drwxrwxr-x 3 dechin dechin   4096 7月  12 10:19 ../
-rw-rw-r-- 1 dechin dechin     37 7月  12 10:22 colvar
-rw-rw-r-- 1 dechin dechin     60 7月  12 10:21 plumed.dat
-rw-r--r-- 1 dechin dechin 519979 11月 18  2020 ref.pdb
drwxr-xr-x 2 dechin dechin   4096 11月 18  2020 .solutions/
-rw-r--r-- 1 dechin dechin 117620 11月 18  2020 traj-broken.xtc
-rw-r--r-- 1 dechin dechin 116036 11月 18  2020 traj-whole.xtc
(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples/trieste-1$ cat colvar 
#! FIELDS time d1
 0.000000 0.095760

但是如果我們把上面的存儲步長STRIDE修改為1的話,得到的colvar就是如下所示的結果:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples/trieste-1$ cat colvar 
#! FIELDS time d1
 0.000000 0.095760
 1.000000 0.096845
 2.000000 0.095885
 3.000000 0.096010
 4.000000 0.095321

這里是將5個step中的所有對應的原子距離都返回了出來。

軌跡文件的格式轉換

上面用到的xtc文件是GROMACS生成的軌跡文件擴展名,由於是二進制文件並不方便讀取,這里我們可以將其轉換成hdf5的格式,然后就可以用python直接來讀取其中的數據。這里我們需要借助於mdtraj這個工具。

用pip安裝mdtraj

經過嘗試用conda來裝失敗了,因此建議直接使用pip來進行安裝:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples/trieste-1$ python3.9 -m pip install mdtraj
Collecting mdtraj
  Downloading mdtraj-1.9.6-cp39-cp39-manylinux_2_5_x86_64.manylinux1_x86_64.whl (6.0 MB)
     |████████████████████████████████| 6.0 MB 1.1 MB/s 
Collecting astunparse
  Using cached astunparse-1.6.3-py2.py3-none-any.whl (12 kB)
Requirement already satisfied: numpy>=1.6 in /home/dechin/anaconda3/envs/AmberTools21/lib/python3.9/site-packages (from mdtraj) (1.21.0)
Requirement already satisfied: scipy in /home/dechin/anaconda3/envs/AmberTools21/lib/python3.9/site-packages (from mdtraj) (1.7.0)
Requirement already satisfied: pyparsing in /home/dechin/anaconda3/envs/AmberTools21/lib/python3.9/site-packages (from mdtraj) (2.4.7)
Requirement already satisfied: six<2.0,>=1.6.1 in /home/dechin/anaconda3/envs/AmberTools21/lib/python3.9/site-packages (from astunparse->mdtraj) (1.16.0)
Requirement already satisfied: wheel<1.0,>=0.23.0 in /home/dechin/anaconda3/envs/AmberTools21/lib/python3.9/site-packages (from astunparse->mdtraj) (0.36.2)
Installing collected packages: astunparse, mdtraj
Successfully installed astunparse-1.6.3 mdtraj-1.9.6

安裝完成后會生成一個名為mdconvert的可執行文件,一般情況是在系統路徑下可以直接指令調用的,下述是mdconvert的幫助文檔:

$ mdconvert -h
usage: mdconvert [-h] 
                 -o OUTPUT         # 必需,指定輸出文件 
                 [-c CHUNK]        # 可選,指定一次讀入內存的幀數,默認1000.
                 [-f]              # 可選,如果輸出文件已存在,則強制覆蓋 
                 [-s STRIDE]       # 可選,只加載 every stride-th frame 
                 [-i INDEX]        # 可選,更加靈活地指定加載特定的幀(Python格式),eg: -i N; -i -1; -i N:M 
                 [-a ATOM_INDICES] # 可選,通過文件指定只加載特定的某些原子,文件內容為原子序號(從0開始計數)
                 [-t TOPOLOGY]     # 可選,指定拓撲文件(PDB/prmtop 格式),一旦指定即可將軌跡輸出為pdb格式。
                 input [input ...] # 必需,指定輸入文件(可以是多條軌跡)

通過mdconvert,可以將上面的案例中所提到的xtc文件配合pdb文件轉化成hdf5格式的文件:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples/trieste-1$ mdconvert -o test.h5 -t ref.pdb traj-whole.xtc 
Warning: 'step' data from input file(s) will be discarded. output format only supports fields: 'xyz', 'time', 'cell_lengths', 'cell_angles', 'velocities', 'kineticEnergy', 'potentialEnergy', 'temperature', 'lambda', 'topology'
converted 5 frames, 6580 atoms

而讀取hdf5的文件,可以用python中的h5py來實現,沒有安裝h5py的可以通過pip簡單的安裝一下:

(base) dechin@ubuntu2004:~/projects/gitlab/dechin/src/plumed/examples/trieste-1$ python3 -m pip install h5py==2.9
Collecting h5py==2.9
  Downloading h5py-2.9.0-cp38-cp38-manylinux1_x86_64.whl (2.8 MB)
     |████████████████████████████████| 2.8 MB 997 kB/s 
Requirement already satisfied: numpy>=1.7 in /home/dechin/anaconda3/lib/python3.8/site-packages (from h5py==2.9) (1.20.2)
Requirement already satisfied: six in /home/dechin/.local/lib/python3.8/site-packages (from h5py==2.9) (1.16.0)
Installing collected packages: h5py
  Attempting uninstall: h5py
    Found existing installation: h5py 3.2.1
    Uninstalling h5py-3.2.1:
      Successfully uninstalled h5py-3.2.1
Successfully installed h5py-2.10.0

具體的h5py的使用方法這里就不進行展開了,可以參考官方的使用文檔

總結概要

本文作為一個入門級的文章,主要介紹了分子動力學模擬中增強采樣的基本概念與相應工具的安裝和使用。PLUMED是業界比較出名的一款增強采樣開源軟件,能夠對接多個分子動力學模擬軟件,如GROMACS等,並利用這些軟件生成的路徑信息來進行采樣。並且為了可以在python上也能看到路徑信息等重要數據,可以考慮使用mdconvert將路徑數據轉化成python上常用的hdf5格式並用h5py進行讀寫。

版權聲明

本文首發鏈接為:https://www.cnblogs.com/dechinphy/p/plumed.html

作者ID:DechinPhy

更多原著文章請參考:https://www.cnblogs.com/dechinphy/

打賞專用鏈接:https://www.cnblogs.com/dechinphy/gallery/image/379634.html

騰訊雲專欄同步:https://cloud.tencent.com/developer/column/91958

參考鏈接

  1. https://www.jianshu.com/p/edbcd57ffa03
  2. https://blog.chembiosim.com/alter-md-trajectory-file-format-with-mdconvert/
  3. https://blog.chembiosim.com/plumed-basics-01/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM