github上DQN代碼的環境搭建，及運行（Human-Level Control through Deep Reinforcement Learning）conda配置

本文轉載自查看原文 2019-02-26 12:02 1020 強化學習

最近師弟在做DQN的實驗，由於是強化學習方面的東西，正好和我現在的研究方向一樣於是我便幫忙跑了跑實驗，於是就有了今天的這個內容。

首先在github上進行搜尋，如下圖：

發現第一個星數最多，而且遠高於其它的項目，於是拉取這個鏈接：

本篇博客主要是講解一下該代碼運行環境的如何搭建，采用 conda 配置。

首先看下 README 上的內容，主要是requirement最重要：

考慮到運行的兼容性，於是決定使用python2.7版本環境運行，下面開始 conda 的配置：

搜尋python2.7版本，並采用最小自版本號

conda search python=2.7

選擇 python2.7.3版本，為環境命名 dqn_2 :

conda create -n dqn_2 python=2.7.3

進入新建環境，並確認版本：

conda activate dqn_2

安裝 numpy scipy

conda install numpy scipy

安裝 tqdm (進度條模塊)

pip install tqdm==4.30

安裝 gym (oepnai 的游戲環境交互模塊)

可選安裝：

pip install gym==0.1.0

必選安裝：

pip install gym[Atari]==0.1.0

安裝 gpu 計算環境 cudatookit 和 cudnn（由於需要安裝深度學習框架 tensorflow-gpu , python27 0.12.1 版本。）

由於安裝的tensorflow-gpu 0.12.1 所依賴的環境，我們選擇 cudatookit8.0 cudnn5.1

如下圖：

conda install cudatoolkit=8.0=3

conda install cudnn=5.1.10=cuda8.0_0

安裝深度學習框架 tensorflow-gpu , 選擇python27 0.12.1 版本。

給出下載地址：

pip install tensorflow_gpu-0.12.1-cp27-none-linux_x86_64.whl

為運行環境設置動態庫地址，目的是為了要程序知道安裝的cudatookit和cudnn的lib位置：

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/devil/anaconda3/envs/dqn_2/lib

其中， dqn_2 為conda 中所設置的運行環境名稱。

運行：

python main.py --env_name=Breakout-v0 --is_train=True

配置成功，並且可運行。

參考資料：

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。