使用Docker搭建多人使用GPU服務器


背景

讓多人共同使用GPU資源而不相互干擾,同時系統資源分配比較靈活。

服務器配置

cpu

48  Intel(R) Xeon(R) Silver 4116 CPU @ 2.10GHz

2顆24核CPU

(指令:

cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c

cat /proc/cpuinfo | grep physical | uniq -c)

安裝顯卡驅動

cd到.run文件目錄
sudo apt-get purge nvidia*
sudo vim /etc/modprobe.d/blacklist-nouveau.conf

寫上:

blacklist nouveau

  options nouveau modeset=0
sudo update-initramfs -u
sudo apt-get install build-essential freeglut3-dev libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
sudo chmod +x NVIDIA-Linux-x86_64-410.104.run
sudo ./NVIDIA-Linux-x86_64-410.104.run --no-opengl-files -no-x-check

安裝docker CE和nvidia-docker

參照https://www.cnblogs.com/journeyonmyway/p/10318624.html

docker安裝錯了卸載docker:

sudo apt-get purge docker

sudo apt-get purge docker-ce

sudo apt-get remove -y docker-*

sudo rm -rf /var/lib/docker

進行驗證 docker --version

 創建容器

docker pull nvidia/cuda:10.0-cudnn7-runtime-ubuntu18.04

(ubuntu和cuda版本查詢:https://hub.docker.com/r/nvidia/cuda/tags

nvidia-docker run -dit --net host --name=cuda1 -h=LAB_VM nvidia/cuda:10.0-cudnn7-runtime-ubuntu18.04

docker exec -it cuda1 /bin/bash

apt-get update

apt-get install net-tools -y
apt-get install inetutils-ping

apt-get install vim

cp /etc/apt/sources.list /etc/apt/sources.list.bak rm /etc/apt/sources.list vim /etc/apt/sources.list 添加清華源 https://mirrors.tuna.tsinghua.edu.cn/help/ubuntu/

apt-get update

apt-get install openssh-server

把   #PermitRootLogin prohibit-password  改為   PermitRootLogin yes

passwd root

service ssh start

cd /home

vim startup.sh

#!/bin/bash service ssh start /bin/bash

chmod 777 startup.sh

exit

打包為鏡像

 參考:

https://blog.csdn.net/hangvane123/article/details/88639279

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM