nvidia-docker安裝
如果之前安裝過docker1.0版本,需要先刪掉該版本和之前創建的容器
- docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
- sudo apt-get purge -y nvidia-docker
添加代碼倉庫
- curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
- sudo apt-key add -
- distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
- curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
- sudo tee /etc/apt/sources.list.d/nvidia-docker.list
- sudo apt-get update
安裝docker 2
sudo apt-get install -y nvidia-docker2 sudo pkill -SIGHUP dockerd
拉取鏡像
sudo nvidia-docker pull
查看拉取鏡像
sudo nvidia-docker images
文件掛載到鏡像
sudo nvidia-docker run -it –v path_local:/workspace /bin/bash
這樣就啟動了一個容器,並且把目錄掛載到了容器的/workspace下。這樣操作的好處是,訓練完的數據可以直接存放在宿主機,省略了從容器中拷貝的繁瑣步驟。
cuda 安裝
https://developer.nvidia.com/cuda-downloads中可以下載cuda。
1. 若下載run文件
終端中輸入:
sudo sh cuda_8.0.61_375.26_linux.run
會報未知錯誤:The driver installation has failed due to an unknown error Driver: Installation Failed,網上沒找到解決方法,放棄了,使用第二種方法。
2. 若下載deb文件
使用如下命令安裝:
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64.deb,
對這句說明下,若無sudo命令,用apt-get install sudo 安裝即可。運行過程中,可能會報錯,can not install due to decompressor pipe: unexpected end of file or stream,可能解壓沒成功,多重復操作幾次,我連續執行此命令三次,最終成功了。
sudo apt-get update sudo apt-get install cuda
之后編輯.bashrc:
gedit .bashrc
但是docker容器內無法編輯,會出現
Failed to connect to Mir: Failed to connect to server socket: No such file or directory
Unable to init server: Could not connect: Connection refused
暫時使用臨時環境,輸入:
export PATH=/usr/local/cuda-8.0/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-8.0/bin/lib64:$LD_LIBRARY_PATH
之后終端中輸入:
nvcc --version
顯示:
Cuda compilation tools, release 8.0, V8.0.44