1、安裝指定版本nvidia 驅動和CUDA

1.下載nvidia驅動和CUDA

nvidia驅動網址https://www.nvidia.cn/Download/index.aspx?lang=cn

nvidia驅動

CUDA網址 https://developer.nvidia.com/cuda-toolkit-archive

CUDA

2.建立nvidia文件夾並拷貝

sudo mkdir /work
sudo chown -R casia:casia /work/
cd /work/
sudo apt-get update
sudo apt-get install -y gcc make python3-pip
mkdir nvidia
cd nvidia/

將下載好的nvidia驅動和CUDA拷貝到改文件夾

3.安裝nvidia驅動和CUDA

sudo sh NVIDIA-Linux-x86_64-450.102.04.run 三次回車
sudo sh cuda_11.0.2_450.51.05_linux.run 
鍵入accept回車->選擇Install回車

4.檢驗

nvidia-smi

2、安裝 nvidia-docker

在使用帶有 cuda 環境的 docker 容器之前，首先需要安裝 nvidia-docker 組件

2.1 安裝docker

方法一：

curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun

方法二：

# 更新 apt 包索引 sudo apt-get update # 安裝 apt 依賴包，用於通過HTTPS來獲取倉庫 sudo apt-get install -y \ apt-transport-https \ ca-certificates \ curl \ gnupg-agent \ software-properties-common # 添加 Docker 的官方 GPG 密鑰 curl -fsSL https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu/gpg | sudo apt-key add – # 使用以下指令設置穩定版倉庫 sudo add-apt-repository \ "deb [arch=amd64] https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu/ \ $(lsb_release -cs) \ stable" # 更新 apt 包索引 sudo apt-get update # 安裝最新版本的 Docker Engine-Community 和 containerd sudo apt-get install -y docker-ce docker-ce-cli containerd.io # 把當前用戶加入到docker組中 sudo gpasswd -a ${USER} docker # 重啟docker服務 sudo service docker restart

2.2 添加 nvidia-docker 源

curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -

curl -s -L https://nvidia.github.io/nvidia-docker/ubuntu18.04/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

sudo apt-get update

2.3 安裝 nvidia-docker2

安裝 nvidia-docker2 后重啟 docker 使得 nvidia-docker2 生效。

$ sudo apt-get install -y nvidia-docker2

$ sudo systemctl restart docker

2.4 配置nvidia-docker

修改/etc/docker/daemon.json文件配置如下


sudo vim /etc/docker/daemon.json

{
    "default-runtime": "nvidia",
    "runtimes": {
        "nvidia": {
            "path": "nvidia-container-runtime",
            "runtimeArgs": []
        }
    }
}


sudo systemctl daemon-reload

sudo systemctl restart docker

3、測試

測試。

python3 -m pip install torch==1.7.1+cu110 torchvision==0.8.2+cu110 -f https://download.pytorch.org/whl/torch_stable.html python3 import torch torch.cuda.is_available() torch.version.cuda torch.zeros(1).cuda(0) torch.zeros(1).cuda(1) torch.zeros(1).cuda(2) torch.zeros(1).cuda(3) torch.zeros(1).cuda(4) torch.zeros(1).cuda(5) torch.zeros(1).cuda(6) torch.zeros(1).cuda(7) torch.cuda.device_count()

如果報錯是GeForce RTX 3080 with CUDA capability sm_86 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 compute_37.那么一定是cuda版本的問題了。安裝cuda版本不對，解決方案：根據算力下載對應版本cuda

作者：blair_liu
鏈接：https://www.jianshu.com/p/8140cbc6ae68
來源：簡書
著作權歸作者所有。商業轉載請聯系作者獲得授權，非商業轉載請注明出處。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 ubuntu20安裝顯卡驅動nvidia-docker，cuda ubuntu安裝cuda、cudnn和nvidia-docker centos7.6安裝顯卡驅動nvidia和nvidia-docker nvidia-docker 安裝 Ubuntu16.04安裝Docker、nvidia-docker centos7 安裝 docker和nvidia-docker Nvidia-Docker安裝、使用基礎 ubuntu---NVIDIA驅動 + CUDA 安裝完可能會遇見的問題 nvidia-docker（GPU）和存儲驅動(storage_driver) NVIDIA驅動安裝、CUDA安裝、cudnn安裝