github上DQN代碼的環境搭建,及運行(Human-Level Control through Deep Reinforcement Learning)conda配置


最近師弟在做DQN的實驗,由於是強化學習方面的東西,正好和我現在的研究方向一樣於是我便幫忙跑了跑實驗,於是就有了今天的這個內容。

首先在github上進行搜尋,如下圖:

 

發現第一個星數最多,而且遠高於其它的項目,於是拉取這個鏈接:

https://github.com/devsisters/DQN-tensorflow

 

 

本篇博客主要是講解一下該代碼運行環境的如何搭建,采用  conda 配置。

 

 

首先看下  README  上的內容, 主要是requirement最重要:

 

考慮到運行的兼容性,於是決定使用python2.7版本環境運行,下面開始  conda  的配置:

 

搜尋python2.7版本,並采用最小自版本號

conda search python=2.7

 

 

選擇  python2.7.3版本, 為環境命名 dqn_2  :

conda create -n dqn_2  python=2.7.3

 

 

 

進入新建環境,並確認版本:

conda activate dqn_2

 

 

 

 

 

 

安裝    numpy  scipy

conda install numpy scipy

 

 

 

 

 

 

 

 

 

安裝   tqdm   (進度條模塊)

pip install tqdm==4.30

 

 

 

 

安裝   gym     (oepnai 的  游戲環境交互模塊)

 

可選安裝:

pip install gym==0.1.0

 

 

必選安裝:

pip install gym[Atari]==0.1.0

 

 

 

 

 

 

 

安裝  gpu 計算環境    cudatookit    和     cudnn(由於需要安裝深度學習框架   tensorflow-gpu ,  python27  0.12.1  版本。)

由於安裝的tensorflow-gpu 0.12.1 所依賴的 環境,我們選擇  cudatookit8.0   cudnn5.1

如下圖:

 

 

conda install cudatoolkit=8.0=3

 

conda install cudnn=5.1.10=cuda8.0_0

 

 

 

 

 

 

 

 

安裝深度學習框架   tensorflow-gpu ,  選擇python27  0.12.1  版本。

給出下載地址:

https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-0.12.1-cp27-none-linux_x86_64.whl

pip install tensorflow_gpu-0.12.1-cp27-none-linux_x86_64.whl

 

 

 

 

為運行環境設置動態庫地址, 目的是為了要 程序知道安裝的cudatookit和cudnn的lib位置:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/devil/anaconda3/envs/dqn_2/lib

其中,   dqn_2   為conda 中所設置的運行環境名稱。

 

 

 

 

運行:

python main.py --env_name=Breakout-v0 --is_train=True

 

 

 

配置成功,  並且可運行。

 

 

 

參考資料:

https://blog.csdn.net/u011636567/article/details/77162217

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM