Ubuntu 14.04.3
CUDA 7.5:cuda-repo-ubuntu1404-7-5-local_7.5-18_amd64.deb
NVIDIA Driver:NVIDIA-Linux-x86_64-361.28.run
Docker Image:kaixhin/cuda-caffe
#############################
1.单独安装Nvidia driver 步骤:
a. 全新安装的Ubuntu14.04.3,下载run文件
b.sudo gedit /etc/modprobe.d/blacklist.conf
在末尾输入下面5行字符串:
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
c. sudo apt-get --purge remove nvidia-*
d. sudo reboot
e. ctrl+alt+f1(返回+f7),输入一下命令:
sudo stop lightdm
init 3
cd ./cuda
sh ..run(run file)(安装过程中全部点yes)
f. sudo reboot
2. 安装CUDA7.5
执行上一步a,b,c
d. dpkg -i ..deb(deb file)
e. sudo apt-get update(保证软件和更新设置中的“更新”中的“重要安全更新”和“推荐更新”选中)
f. sudo apt-get install cuda
g.执行 echo 'export PATH=/usr/local/cuda-7.5/bin:$PATH' >> ~/.bashrc | echo 'export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc | source ~/.bashrc
h. sudo reboot
i.cd /etc/local/cuda-7.5/samples | sudo make
j. cd /bin/x86_64/linux/release | ./devicequery
3. 使用Docker
使用Docker中的Caffe image:kaixhin/cuda-caffe
cuda-caffe中配置了cuda7.5 和 Caffe,使用 docker pull kaixhin/cuda-caffe 命令下载该镜像。但是该景象要求Nvidia Driver版本为352.39,而使用上述步骤安装的CUDA7.5.deb文件中自带的driver为更新的版本,所有导致container中无法使用GPU。
因此需要将此前安装的deb文件卸载,命令为: sudo apt-get --purge autoremove cuda | sudo apt-get --purge remove nvidia-*
到NVIDIA官网下载Cuda_7.5.18_linux.run文件,然后使用1中的方法安装run文件。
然后重启,到/usr/local/cuda-7.5/samples 中进行编译,测试通过即成功。
使用 docker run -it --device /dev/nvidiactl --device /dev/nvidia-uvm --device /dev/nvidia0 kaixhin/cuda-caffe,进入cuda-caffe容器,使用下述命令
$ cd /data/mnist
$ ./get_mnist.sh
$ ./examples/mnist/create_mnist.sh
$ ./examples/mnist/train_lenet.sh
成功运行,测试通过。