Ubuntu 14.04.3
CUDA 7.5:cuda-repo-ubuntu1404-7-5-local_7.5-18_amd64.deb
NVIDIA Driver:NVIDIA-Linux-x86_64-361.28.run
Docker Image:kaixhin/cuda-caffe
#############################
1.單獨安裝Nvidia driver 步驟:
a. 全新安裝的Ubuntu14.04.3,下載run文件
b.sudo gedit /etc/modprobe.d/blacklist.conf
在末尾輸入下面5行字符串:
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
c. sudo apt-get --purge remove nvidia-*
d. sudo reboot
e. ctrl+alt+f1(返回+f7),輸入一下命令:
sudo stop lightdm
init 3
cd ./cuda
sh ..run(run file)(安裝過程中全部點yes)
f. sudo reboot
2. 安裝CUDA7.5
執行上一步a,b,c
d. dpkg -i ..deb(deb file)
e. sudo apt-get update(保證軟件和更新設置中的“更新”中的“重要安全更新”和“推薦更新”選中)
f. sudo apt-get install cuda
g.執行 echo 'export PATH=/usr/local/cuda-7.5/bin:$PATH' >> ~/.bashrc | echo 'export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc | source ~/.bashrc
h. sudo reboot
i.cd /etc/local/cuda-7.5/samples | sudo make
j. cd /bin/x86_64/linux/release | ./devicequery
3. 使用Docker
使用Docker中的Caffe image:kaixhin/cuda-caffe
cuda-caffe中配置了cuda7.5 和 Caffe,使用 docker pull kaixhin/cuda-caffe 命令下載該鏡像。但是該景象要求Nvidia Driver版本為352.39,而使用上述步驟安裝的CUDA7.5.deb文件中自帶的driver為更新的版本,所有導致container中無法使用GPU。
因此需要將此前安裝的deb文件卸載,命令為: sudo apt-get --purge autoremove cuda | sudo apt-get --purge remove nvidia-*
到NVIDIA官網下載Cuda_7.5.18_linux.run文件,然后使用1中的方法安裝run文件。
然后重啟,到/usr/local/cuda-7.5/samples 中進行編譯,測試通過即成功。
使用 docker run -it --device /dev/nvidiactl --device /dev/nvidia-uvm --device /dev/nvidia0 kaixhin/cuda-caffe,進入cuda-caffe容器,使用下述命令
$ cd /data/mnist
$ ./get_mnist.sh
$ ./examples/mnist/create_mnist.sh
$ ./examples/mnist/train_lenet.sh
成功運行,測試通過。