機器學習/深度學習/其他開發環境搭建記錄


摘要:

  python源碼安裝

  python虛擬環境(py2.7 virtualenv)

  python下mysql支持

  pyspark環境

  xgboost4.0安裝

  tensorflow安裝(cpu,gpu)

  keras安裝

  libffm安裝

  python-mysql安裝

  lightGBM安裝

  mongodb安裝

  python打包egg

內容:

=======================================python源碼安裝===================================================

在項目部署的過程中發現公司centos系統中沒有bz2編解碼支持,從而python引用bz2失敗,不得已只好重新裝了一遍python

下載安裝包:https://www.python.org/downloads/release/python-352/

tar xvf Python-3.5.2.tgz

cd Python-3.5.2

mkdir /usr/local/python3.5

./configure --prefix=/usr/local/python3.5

 make;make install

如果報錯:Ignoring ensurepip failure: pip 8.1.1 requires SSL/TLS,則yum install openssl-devel

 

=======================================python虛擬環境(py2.7 virtualenv)===================================================

場景介紹:部署python應用的時候總會碰到版本的問題,python不像java 有meavn這種自動構建和打包的工具,所以是通過在項目下安裝虛擬環境解決的;

那么我遇到的問題是服務器中大部分版本是python2.6,而我需要一個至少python2.7的環境。所以既需要安裝python包,又需要安裝虛擬環境

1.python源碼安裝(如上)

2.安裝virtualenv

pip install virtualenv   #py2安裝

virtualenv --no-site-packages --python=/usr/local/python2.7/bin/python py27venv

啟動虛擬環境

source $py27venv_home/bin/activate

關閉虛擬環境

source $py27venv_home/bin/deactivate

=======================================python下mysql支持===================================================

1.下載對應的connecter包,下載鏈接:https://dev.mysql.com/downloads/connector/python/

2.編譯器編輯代碼,識別了mysql.connector包

centos7下py3安裝

在以上鏈接沒有找到相應系統,相應python版本的驅動包,所以改用pymysql這個類庫。這個直接pip就可以了

pip install PyMySQL

=======================================pyspark環境安裝===================================================

 1.所需安裝包:spark官網下載鏈接:http://spark.apache.org/downloads.html

 2.解壓spark包,將spark下python\pyspark目錄拷貝到python安裝目錄的Lib/site-packages下

 3.pip install Py4J

 順便百度了下這是啥玩意:

  

 4.編譯器編輯代碼,識別了pyspark包

=======================================xgboost4.0安裝===================================================

1.所需工具

  我用到了git(內含git bash),Visual Studio 2012(10及以上就可以),xgboost源碼(0.4版本),java 環境還需要maven(Win)

  附:Visual Studio 2012下載 xgboost源碼(0.4版本)鏈接:http://pan.baidu.com/s/1i4Kem5B 密碼:ieox

   

2.詳細過程

  在windows文件里面打開sln文件 , 選release  x64 編譯

  

  4個項目都得生成一下

  會報錯,修改為Sleep

     

  對應文件點擊生成

   

  正確輸出如下

   

  檢查”…/xgboost-master/windows/x64/Release/”問件夾下是否含有“xgboost_wrapper.dll”如果含有,就表示前面兩步都成功了,下面進入最后一步安裝的過程。

  

   python 安裝

   打開”…/xgboost-master/python-package/”

   打開git bash,輸入”python setup.py install”即可

   

  

  java 安裝

  復制xgboost_wrapper.dll   xgboostjavawrapper.dll粘貼到xgboost-master\Java 里面 

  通過maven下載commons-lang3-3.1.jar(不懂的搜下maven的commons-lang3-3.1.jar依賴)

  也放到xgboost-master\java 里面

  在xgboost-master\java 里面,下載一下這個代碼,鏈接:http://pan.baidu.com/s/1dEWxABv 密碼:d6cs   替換掉xgboost4j 里面的代碼

    然后xgboost-master\java\xgboost4j\src\main\resources\lib 的dll文件刪掉,用你前面編譯好的xgboostjavawrapper.dll替換

  之后java文件里面應該是這樣的:

命令行 cd  到xgboost-master\java\xgboost4j 里面  mvn package(git bash 推薦)

 

如果結果是這樣表示生成jar包成功,把jar包添加到工程里面就ok了。

 

3.驗證

  python 環境驗證

  

   java 環境驗證

  將xgboost4j-1.1.jar add 到自己的library

  引包正常

4.使用指南
  參數:http://blog.csdn.net/bryan__/article/details/52056112

5.參數調優

  http://blog.csdn.net/wzmsltw/article/details/50994481

  http://xgboost.readthedocs.io/en/latest/parameter.html#general-parameters

  http://xgboost.readthedocs.io/en/latest/python/python_api.html

 6.linux安裝

  在XGboost根路徑運行:cp make/config.mk config.mk 
  修改config.mk:

  vim config.mk 

  添加gcc和g++路徑

  export CC = /data/gcc-4/bin/gcc 
  export CXX = /data/gcc-4/bin/g++

  保存,然后運行: 
  make -j4

  cd python-package

  python setup.py install

=======================================tensorflow(1.0.0版本)安裝===========================================

  1.所需工具 python3.5.x  numpy-1.11.3 (win7_64bit)

  2.詳細過程

   本文采用離線安裝方式:

  先安裝依賴numpy:

  

  最后安裝tensorflow:

  

  3.驗證

 

 

 以下是gpu版安裝

   所需環境:

 python3.5.x 

 Visual Studio 2012

   gpu(確認你的顯卡支持 CUDA,這里確認) 

   cuda

   cuDNN

   安裝順序:

   先安裝Visual Studio 2012,然后安裝cuda,下載解壓cuDNN

   之后將一定將cuda添加到path環境變量中,然后將cuDNN的目錄拷貝到cuda的安裝目錄中

cuDNN解壓目錄:

 

cuda默認安裝目錄:

     添加環境變量:

 

 最后用pip3安裝tensorflow

pip3 install --upgrade tensorflow-gpu

測試:

 =======================================keras 安裝===================================================

pip install keras

win10安裝的時候報錯:No Lapack/Blas Resources Found

解決下載自己對應py版本和win版本的scipy的包,再pip install 對應whl的scipy即可,然后安裝keras 成功 

=======================================libffm1.14.0 安裝===================================================

系統:centos7_64

所需工具:gcc(推薦4.8.0以上)

下載 libffm-master.zip

unzip libffm-master.zip
cd libffm-master
編譯:make
測試:ffm-train bigdata.tr.txt model

 ======================================= mysql-python 安裝===================================================

 系統:win7_64bit

所需工具:

編譯工具:VCforPython27 ,

mysql驅動:

64位:MySQL-python-1.2.3.win-amd64-py2.7.exe 
32位: MySQL-python-1.2.5.win32-py2.7.exe

最后:pip install mysql

參考鏈接:http://blog.csdn.net/lcr_happy/article/details/73252819        http://blog.csdn.net/w2cschool/article/details/40520233

========================================= lightGBM安裝 ======================================================

系統:CentOS release 6.5_x86_64 (Final)

工具:GCC-4.8.4 

mpfr-2.4.2 
gmp-4.3.2 
mpc-0.8.1 
LightGBM-Github

cmake-3.9.0-Linux-x86_64.tar.gz(注意系統位數)

安裝過程:

安裝gmp

  1. tar jxvf gmp-4.3.2.tar.bz2
  2. cd gmp-4.3.2
  3. mkdir build;cd build
  4. ../configure --prefix=/data/gmp
  5. make -j4
  6. make install

注意 --prefix= 一定要配置到/data目錄,因為其他目錄沒有寫權限的哦!--prefix=就是配置安裝路徑的意思

安裝mpfr

  1. tar jxvf mpfr-2.4.2.tar.bz2
  2. cd mpfr-2.4.2
  3. mkdir build;cd build
  4. ../configure --prefix=/data/mpfr --with-gmp=/data/gmp
  5. make -j4
  6. make install

記得一定要加--with-gmp=/data/gmp

安裝mpc

  1. tar xzf mpc-0.8.1.tar.bz
  2. cd mpc-0.8.1
  3. mkdir build;cd build
  4. ../configure --prefix=/data/mpc --with-gmp=/data/gmp --with-mpfr=/data/mpfr
  5. make -j4
  6. make install

安裝GCC

先將以上安裝的依賴庫添加到環境變量

  1. echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/data/mpc/lib:/data/gmp/lib:/data/mpfr/lib' >> ~/.bashrc
  2. source ~/.bashrc

再回到/data,進行安裝GCC

  1. tar jxvf gcc-4.8.4.tar.bz2
  2. cd gcc-4.8.4
  3. mkdir build;cd build
  4. ../configure --prefix=/data/gcc-4 -enable-threads=posix -disable-checking -disable-multilib --enable--long-long -enable-languages=c,c++,java --with-gmp=/data/gmp --with-mpfr=/data/mpfr --with-mpc=/data/mpc
  5. make -j4
  6. make install

其中make的過程估計要等40分鍾左右,然后到此GCC就編譯安裝成功啦

安裝cmake

  1. tar zxvf cmake-3.9.0-Linux-x86_64.tar.gz
  2. echo 'export PATH=$PATH:/data/cmake-3.9.0-Linux-x86_64/bin' >> ~/.bashrc
  3. source~/.bashrc

安裝LightGBM

此時,如果你想把gcc添加到/usr/local/bin里面是不行的,因為沒有寫權限,所以我們配置一下LightGBM編譯時調用的GCC即可。LigthGBM是先通過Cmake生成的,所以編輯CMakeLists.txt即可。

  1. cd LigthGBM
  2. vim CMakeLists.txt
  3. # 添加以下代碼在文件開頭
  4. SET(CMAKE_C_COMPILER "/data/gcc-4/bin/gcc")
  5. SET(CMAKE_CXX_COMPILER "/data/gcc-4/bin/g++")
  6. # 保存退出后,就跟着官網教程,默認方式安裝即可
  7. mkdir build ; cd build
  8. cmake ..
  9. make -j4
  10. python ../python-package/setup.py install

附:win下pip 可以直接安裝 

======================================================mongodb安裝================================================================================

安裝包:下載地址:https://www.mongodb.com/download-center#community

下文以mongodb的主目錄是為例,建立data,logs,和logs/mongo.log.

在主目錄添加配置文件如下:

dbpath=D:\MongoDB\Server\3.4\data #數據庫路徑  
logpath=D:\MongoDB\Server\3.4\logs\mongo.log #日志輸出文件路徑  
logappend=true #錯誤日志采用追加模式  
journal=true #啟用日志文件,默認啟用  
quiet=true #這個選項可以過濾掉一些無用的日志信息,若需要調試使用請設置為false  
port=27017 #端口號 默認為27017  

啟動服務

mongod --config "D:\MongoDB\Server\3.4\mongo.conf" --install --serviceName "MongoDB"  
net start MongoDB  

驗證服務

======================================================python打包egg================================================================================ 

背景:在pyspark開發的過程中driver程序需要引用其他的python模塊,所以這里需要用python打成egg供spark worker中調用

新建一個setup.py文件,例子如下:

 1 from setuptools import setup,find_packages
 2 setup(
 3     name='your_mod',
 4     version='1.0',
 5     url='',
 6     license='',
 7     author='arachis',
 8     author_email='arachis@xxxx.cn',
 9     description='',
10     packages = find_packages(),
11 )

然后運行python setup.py bdist_egg,如下是運行之后生成的三個目錄:

 

而dist目錄下就是我們需要的egg包:

 

安裝egg包

easy_install your_mod-1.0-py2.7.egg


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM