首先是moses工具的官網網站
在編譯安裝moses工具包之前需要做一些准備工作
1:安裝boost庫
yum install boost
yum install boost-devel
yum install boost-doc
三條命令下來安裝完畢,詳細測試過程參考另外一篇博客linux下boost庫的安裝
2:安裝GIZA++工具包
GIZA++是一個統計機器翻譯工具,是用來訓練IBM模型1-5和HMM詞對齊模型的。該軟件包還包含了mkcls等生成單詞訓練生成對准模型的工具。使用下面的命令下載並編譯GIZA++:該項目已經托管到github上了https://github.com/moses-smt/giza-pp
git clone https://github.com/moses-smt/giza-pp.git
cd giza-pp
make(詳細的編譯過程參考另外一篇博客GIZA++工具使用介紹
3:安裝IRSTLM
該項目同樣托管到github上了https://github.com/irstlm-team/irstlm
在編譯IRSTLM之前,需要安裝兩個工具。由於IRSTLM的腳本 regenerate-makefiles.sh 用到了aclocal 命令,而此命令在automake 包中,因此先安裝 automake 包。另外還需要安裝libtool。使用下面的命令來安裝這兩個工具:
$ yum install automake
$ yum install libtool
git clone git://github.com/irstlm-team/irstlm.git
$ cd irstlm
$ ./regenerate-makefiles.sh
$ ./configure --prefix=/path/to/irstlm (這里的路徑是配置的希望安裝irstlm的路徑)
$ make
$ sudo make install
這樣就編譯安裝好了IRSTLM,在安裝路徑下新增了三個目錄bin/,include/,以及lib/。bin/下面包括了許多可執行腳本,其中就包括創建語言模型的腳本build-lm.sh。
4:安裝moses
moses現在同樣已經托管到github上面去了
git clone git://github.com/moses-smt/mosesdecoder.git
cd mosesdecoder
./bjam -j8 --with-irstlm=/users4/xyan/software_new/irstlm --with-giza=/users4/xyan/software_new/giza-pp-master
其中,-j8是說明CPU是8核的,另外兩個參數分別指定了IRSTLM和GIZA++的路徑,耐心等待一段時間,會看到編譯成功的提示,顯示success。
到這moses就安裝好了。
