什么是PaddlePaddle
PaddlePaddle,百度旗下深度學習開源平台。Paddle(Parallel Distributed Deep Learning,並行分布式深度學習)。
2016年9月27日,百度宣布其全新的深度學習開源平台PaddlePaddle在開源社區Github及百度大腦平台開放,供廣大開發者下載使用。
以下內容,主要拷貝於 《PaddlePaddle系列》筆記一——PaddlePaddle的安裝
blog.csdn.net/qq_33200967/article/details/79071926
安裝與編譯 (我的筆記本,只能用3代碼編譯,因為我的筆記本不支持AVX)
環境
系統:Ubuntu 16.0.4(64位)
處理器:Intel(R) Celeron(R) CPU
內存:4G
安裝依賴環境
在一切開始之前,先要安裝好依賴環境,下面表格是官方給出的依賴環境
依賴 版本 說明
GCC 4.8.2 推薦使用CentOS的devtools2
CMake >=3.2
Python 2.7.x 依賴libpython2.7.so
pip >=9.0
numpy
SWIG >=2.0
Go >=1.8 可選
使用pip安裝
如果你還沒有在pip命令的話,首先要安裝pip,要確保安裝的pip版本是大於9.0.0的,否則可能無法安裝paddlepaddle。
安裝pip命令如下:
sudo apt install python-pip
安裝之后,還有看一下pip的的版本pip --version,如果版本低於9.0.0,那要先升級pip,先要下載一個升級文件,命令如下:
wget https://bootstrap.pypa.io/get-pip.py
下載完成之后,可以使用這個文件安裝最新的pip了
python get-pip.py
安裝pip就可以動手安裝paddlepaddle了。如果權限不夠,請在root下執行命令
pip install paddlepaddle
現在就測試看看paddlepaddle有沒有,在python的命令終端中試着導入paddlepaddle包:
import paddle.v2 as paddle
paddle.init(use_gpu=False, trainer_count=1)
如果沒有報錯的話就證明paddlepaddle安裝成功了
使用Docker安裝運行
為什么要使用Docker安裝paddlepaddle呢,Docker是完全使用沙箱機制的一個容器,在這個容器安裝的環境是不會影響到本身系統的環境的。通俗來說,它就是一個虛擬機,但是它本身的性能開銷很小。在使用Docker安裝paddlepaddle前,首先要安裝Docker,通過下面的命令就可以安裝了:
sudo apt-get install -y docker.io
安裝完成之后,可以使用docker --version查看Docker的版本,如果有顯示,就證明安裝成功了。可以使用docker images查看已經安裝的鏡像。
一切都沒有問題之后,就可以用Docker安裝paddlepaddle了,命令如下:
docker pull docker.paddlepaddle.org/paddle
在Docker中執行PaddlePaddle訓練程序
假設您已經在當前目錄(比如在/home/work)編寫了一個PaddlePaddle的程序 train.py (可以參考 PaddlePaddleBook 編寫),就可以使用下面的命令開始執行訓練:
cd /home/work
docker run -it -v $PWD:/work paddlepaddle/paddle /work/train.py
用代碼編譯PaddlePaddle
安裝GCC
一般現在的Ubuntu都是高於個版本了,可以使用gcc --version查看安裝的版本。比如筆者的是4.8.4,如果你的是版本是低於4.8.2的就要更新一下了
sudo apt-get install gcc-4.9
安裝CMake
命令行安裝
sudo apt-get install cmake
或者源碼安裝
wget https://cmake.org/files/v3.8/cmake-3.8.0.tar.gz
解壓源碼
tar -zxvf cmake-3.8.0.tar.gz
依次執行下面的代碼
# 進入解壓后的目錄
cd cmake-3.8.0
# 執行當前目錄的bootstrap程序
./bootstrap
# make一下
make
# 開始安裝
sudo make install
查看是否安裝成功,cmake --version,如果正常顯示版本,那已經安裝成功了。
安裝pip
關於安裝pip9.0.0以上的版本,在上面的使用pip安裝部分已經講了,這里就不在熬述了
安裝numpy
安裝numpy很簡單,一條命令就夠了
sudo apt-get install python-numpy
順便多說一點,matplotlib這個包也經常用到,順便安裝一下
sudo apt-get install python-matplotlib
安裝SWIG
執行下面代碼安裝SWIG,安裝成功之后,使用swig -version檢查安裝結果
sudo apt-get install -y git curl gfortran make build-essential automake swig libboost-all-dev
安裝Go
官方說可選擇,那看情況吧,如果像安裝安裝吧,筆者順便安裝了,就一條代碼的事情,老規則go version
sudo apt-get install golang
到這里,依賴環境就已經安裝好了,准備安裝paddlepaddle
首先要在GitHub上獲取paddlepaddle源碼
git clone https://github.com/PaddlePaddle/Paddle.git
進入剛下載的Paddle里面
cd Paddle
# 創建一個build文件夾
mkdir build
# 進入build文件夾里
cd build
# 這就要選好你的需求了,比如筆者沒有使用GPU,不支持AVX,不要少了..
cmake .. -DWITH_GPU=OFF -DWITH_AVX=OFF
# 最后make,生成你想要的安裝包,這個可能很久,一定要有耐心, ....(我的筆記本跑了4個多小時)
make
經過長久的make之后,終於生成了我們想要的安裝包,它的路徑在Paddle/build/python/dist下,比如筆者在該目錄下有這個安裝包paddlepaddle-0.0.0-cp27-cp27mu-linux_x86_64.whl,你的命名可能不是這個。之后就可以安裝了,使用pip安裝:
請切入到該目錄
cd build/python/dist/
# 每個人的安裝包名字可能不一樣。如果權限不夠,請在root下執行命令
pip install paddlepaddle-0.0.0-cp27-cp27mu-linux_x86_64.whl
這個我們就已經安裝了paddlepaddle,現在就測試看看paddlepaddle有沒有安裝成功了,在python的命令終端中試着導入paddlepaddle包:
import paddle.v2 as paddle
paddle.init(use_gpu=False, trainer_count=1)
如果沒有報錯的話就證明paddlepaddle安裝成功了
結果還是報錯,Illegal instruction (core dump) ,我猜是不是之前安裝版本未覆蓋。
sudo rm /usr/local/lib/python2.7/dist-packages/paddl*
pip install paddlepaddle-0.0.0-cp27-cp27mu-linux_x86_64.whl
重試OK!