一、平台環境
先說一下我自己的平台環境:
-
系統:Ubuntu 20.04.2 LTS
-
CPU:Intel Core i7-7700 @ 3.60GHz*8
-
顯卡:NVIDIA GeForce RTX 2060
-
顯卡驅動版本:450.102.04
-
CUDA版本:11.0.3
二、Docker的安裝和啟動
1、運行下面的命令安裝:
sudo apt-get update
sudo apt-get install docker.io
2、運行下面的命令啟動Docker:
systemctl start docker
systemctl enable docker
3、運行這條命令檢查是否安裝成功:
sudo docker version
三、安裝NVIDIA Container Toolkit
1、添加源(安裝之前請先確保顯卡驅動已經安裝好了)
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
&& curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
&& curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list \
| sudo tee /etc/apt/sources.list.d/nvidia-docker.list
2、安裝NVIDIA Container Toolkit並重啟Docker
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker
3、安裝完成之后可以新建一個容器測試一下:
sudo docker run -it --name test_nvidia_docker --gpus all nvidia/cuda:11.0-base
其中最后的參數是nvidia/cuda:11.0-base
是根據我的cuda版本設置的參數,具體可以根據工作站主機的cuda版本進行修改,版本查看舊用nvcc -V
查看。
進入容器之后可以跑一下nvidia-smi
查看到顯卡的驅動,然后就可以在docker里正常使用GPU了。
四、Docker常見使用方法
4.1 鏡像的生成方法:
1、原創:從無到有,創建鏡像
2、借用:下載別人創建好的鏡像
3、改進:在現有的鏡像上創建新的鏡像
查看鏡像:
sudo docker iamges
查找鏡像:
sudo docker search [OPTION] [TERM]
獲取鏡像:
sudo docker pull [OPTION] NAME[:TAG|@DIGEST]
刪除鏡像:
sudo docker rmi [OPTION] IMAGE[IMAGE...]
4.2 容器的基本管理和使用
運行一個新容器:
sudo docker run -it --name [NAME] -V [SOURCE:DESTINATION] --gpus all nvidia/cuda:11.0-base
啟動一個已有容器:
sudo docker start [NAME]