2020.5.28更新
服務器進了回收站,再恢復,就又要重新安裝 driver 顯卡驅動, 不過 /usr/local/cuda 路徑及文件還在,真是奇怪! 之前還以為是沒有關閉正在利用 GPU 的進程導致的,但測試關了也會這樣。
2020.5.10 更新
系里的服務器似乎自帶了 driver 顯卡驅動,但是沒有裝 cuda https://blog.csdn.net/qq_38451119/article/details/83302585
不存在路徑/usr/local/cuda, 仍需要自己安裝 cuda 和 cudnn。 自己安裝 cuda 最好把原來自帶的 driver 覆蓋掉,避免版本沖突。
在裝軟件包的時候,似乎可以連上清華的鏡像 裝 progress, 但是 ping baidu.com 似乎不通。
2019.11.16
為了使用遠程的雲服務器,必須要自己配置環境,這次還算比較順利。
1. 安裝cuda https://blog.csdn.net/wanzhen4330/article/details/81699769 ( 安裝cuda = nvidia driver + cuda toolkit + cuda samples + others)
從本地下載好 cuda 的安裝包,然后使用 ssh 遠程上傳上去,然后 運行 .run 文件。 用戶協議文件太長,不想看可以直接按 ctrl+c, 然后 accept 即可。,
因為是在虛擬機上, 似乎不用關閉之前的驅動,步驟較為簡單。可以直接安裝 nvidia driver 驅動,安裝完后,使用 nvidia-smi 查看是否安裝成功,發現居然是兩塊 Tesla V100 顯卡。
這里似乎驅動一定要安裝,否則會出現“no CUDA-capable device is detected”報錯 https://blog.csdn.net/flowrush/article/details/80254301。也就是說,只裝 cuda 的 toolkit , 沒裝顯卡驅動,還是用不了顯卡。當然顯卡驅動可以和 cuda 一同安裝,也可以獨立安裝。為避免版本沖突,最好一起安裝。
注意一定要設置環境變量,否則后續調用 tensorflow 或者 pytorch 可能會出現意想不到的錯誤
使用 nvcc -- version 可以查看安裝的 cuda 的版本
從本地下好 cudnn 的安裝包,然后使用 ssh 遠程上傳上去,然后只需進行少量copy 和授予可運行的權限即完成安裝,
注意 tar -zxvf 命令 第一次用。
3. 安裝 Anaconda
從本地上傳安裝包后直接運行安裝。
設置環境變量 https://blog.csdn.net/weixin_41983807/article/details/90181625
vim ~/.bashrc
寫入 export "PATH=$PATH: xxx/anaconda3/bin"
source ~/.bashrc
然后輸入 python,看是否成功
或者 用 echo 命令
1)sh 安裝包.sh
2)cd /home/tianxiaoxiao/package //先定位到當前安裝包目錄下
echo 'export PATH ="/home/tianxiaoxiao/anaconda3/bin:$PATH"' >> ~/.bashrc
source ~/.bashrc
小插曲:誤輸入 export "PATH=PATH: xxx/anaconda3/bin" 后導致出錯,vim 命令都無法識別了,要用 /usr/bin/vim 。使用 /usr/bin/vim 打開文件,並修改后,使用 source ~/.bashrc 仍然出錯,因為此時 PATH 對應的值仍然是錯誤的,無法在本窗口內恢復。這時重新打開一個窗口就好了。
4. 安裝 pytorch https://blog.csdn.net/suan2014/article/details/80410144 https://blog.csdn.net/felicityPY/article/details/90233374
從清華鏡像站點 https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/ 下載對應安裝包,然后遠程上傳上去,然后 使用 conda install 安裝
5. 安裝 torchvision
從清華鏡像站點 https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/ 下載對應安裝包,同樣使用 conda install 安裝
注:第 4 步、第 5 步也許可以在線安裝。
6.測試顯卡是否可用
打開python
import torch, torchvision
torch.cuda.is_available()
7. 安裝 progress (有需求就安裝)
pip install progress
比 conda install progress 方便很多。