docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].


docker使用--gpus all報錯:

docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].

在網上查詢了很多文章,總結起來就是要安裝nvidia-container-toolkitnvidia-container-runtime(包含nvidia-container-toolkit)
但是尷尬的是怎么都安裝不了nvidia-container-toolkit,一直顯示 ** E: Unable to locate package nvidia-container-toolkit**

網上的解決方案:

  • distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
  • curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
    這個大家應該比較熟,老版本的docker安裝都會使用這個進行添加GPG key
  • curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo
    或者curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
  • sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
  • sudo systemctl restart docker

上面的方法我都進行了嘗試,這里要注意第三步,centos和Ubuntu命令不一樣!

使用上面的命令我還是安裝不了,最后解決的過程記錄如下:

  • 更改系統源為阿里的鏡像源
  • distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
  • curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - 正常會顯示OK
  • curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list 我的系統是Ubuntu18.04
  • sudo apt-get update 這一步要保證沒得問題,我的顯示有幾個源重復配置,然后我就將其(sudo vim nvidia-docker.list)注釋掉
  • sudo apt-get install nvidia-container-toolkit

總結

實現路徑是一樣的,就是更新源那么簡單嗎?實際上公司的網絡非常差很不穩定,導致很多步驟不能正常執行,如sudo apt-get update一會可以正常執行,一會報錯。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM