Ubuntu 遠程離線配置 pytorch 運行環境


2020.5.28更新

服務器進了回收站,再恢復,就又要重新安裝 driver 顯卡驅動, 不過 /usr/local/cuda 路徑及文件還在,真是奇怪! 之前還以為是沒有關閉正在利用 GPU 的進程導致的,但測試關了也會這樣。

 

2020.5.10 更新

系里的服務器似乎自帶了 driver 顯卡驅動,但是沒有裝 cuda https://blog.csdn.net/qq_38451119/article/details/83302585

不存在路徑/usr/local/cuda, 仍需要自己安裝 cuda 和 cudnn。 自己安裝 cuda 最好把原來自帶的 driver 覆蓋掉,避免版本沖突。

在裝軟件包的時候,似乎可以連上清華的鏡像 裝 progress, 但是 ping baidu.com 似乎不通。

 

2019.11.16

為了使用遠程的雲服務器,必須要自己配置環境,這次還算比較順利。

1. 安裝cuda https://blog.csdn.net/wanzhen4330/article/details/81699769  ( 安裝cuda = nvidia driver + cuda toolkit + cuda samples + others)

從本地下載好 cuda 的安裝包,然后使用 ssh 遠程上傳上去,然后 運行 .run 文件。 用戶協議文件太長,不想看可以直接按 ctrl+c, 然后 accept 即可。,

因為是在虛擬機上, 似乎不用關閉之前的驅動,步驟較為簡單。可以直接安裝 nvidia  driver 驅動,安裝完后,使用 nvidia-smi 查看是否安裝成功,發現居然是兩塊 Tesla V100 顯卡。

這里似乎驅動一定要安裝,否則會出現“no CUDA-capable device is detected”報錯 https://blog.csdn.net/flowrush/article/details/80254301。也就是說,只裝 cuda 的 toolkit , 沒裝顯卡驅動,還是用不了顯卡。當然顯卡驅動可以和 cuda 一同安裝,也可以獨立安裝。為避免版本沖突,最好一起安裝。

 

 

注意一定要設置環境變量,否則后續調用 tensorflow 或者 pytorch 可能會出現意想不到的錯誤

使用 nvcc -- version 可以查看安裝的 cuda 的版本

 

 

 

2. 安裝 cudnn

從本地下好 cudnn 的安裝包,然后使用 ssh 遠程上傳上去,然后只需進行少量copy 和授予可運行的權限即完成安裝,

注意 tar -zxvf 命令 第一次用。

 

 

 

3. 安裝 Anaconda

從本地上傳安裝包后直接運行安裝。

 

 

設置環境變量 https://blog.csdn.net/weixin_41983807/article/details/90181625

vim ~/.bashrc

寫入 export "PATH=$PATH: xxx/anaconda3/bin"

source ~/.bashrc

然后輸入 python,看是否成功

或者 用 echo 命令

1)sh 安裝包.sh
2)cd /home/tianxiaoxiao/package //先定位到當前安裝包目錄下
echo 'export PATH ="/home/tianxiaoxiao/anaconda3/bin:$PATH"' >> ~/.bashrc
source ~/.bashrc

 

 

小插曲:誤輸入 export "PATH=PATH: xxx/anaconda3/bin" 后導致出錯,vim 命令都無法識別了,要用 /usr/bin/vim 。使用 /usr/bin/vim 打開文件,並修改后,使用 source ~/.bashrc 仍然出錯,因為此時 PATH 對應的值仍然是錯誤的,無法在本窗口內恢復。這時重新打開一個窗口就好了。

 

4. 安裝 pytorch   https://blog.csdn.net/suan2014/article/details/80410144  https://blog.csdn.net/felicityPY/article/details/90233374

從清華鏡像站點 https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/ 下載對應安裝包,然后遠程上傳上去,然后 使用 conda install 安裝

 

5. 安裝 torchvision

從清華鏡像站點 https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/ 下載對應安裝包,同樣使用 conda install 安裝

 

注:第 4 步、第 5 步也許可以在線安裝。

 

6.測試顯卡是否可用

打開python

import torch, torchvision

torch.cuda.is_available()

 

7. 安裝 progress (有需求就安裝)

pip install progress

比 conda install progress 方便很多。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM