1 簡介
- Anaconda:是一個開源的Python發行版本,其包含了conda、Python等軟件包,numpy,pandas,scipy等科學計算包.
- Conda:包管理器, venv+pip的作用,也就是虛擬環境+包管理。
- Nvidia: 顯卡制造商。
- 顯卡:承擔輸出顯示圖形的任務。
- GPU:圖形處理器,是顯卡內部的處理器,
- cuda:Nvidia推出的運算平台,用於並行計算的框架,使GPU能夠解決負責的計算問題。
- cudnn: 針對深度卷積神經網絡的加速庫
- 顯卡驅動: 可以調用GPU並行計算能力的驅動程序
2 前言
- 圖片中的實例路徑為文件夾以sl示例,實際操作中更改為本人用戶。
- 數據和軟件存放建議存放於 /data/用戶 ,小文件可以存放於 /home/用戶,通過df -h命令可以查看磁盤使用情況,data下共有3.6T可用。
- 實際操作通過第四台服務器為例
- 建議使用MobaXterm連接服務器:具體信息請參考
3 Anaconda 安裝
- Anaconda下載
-
上傳安裝包到服務器
通過MobaXterm工具可以快速將剛才下載的安裝包上傳到服務器中
-
Anaconda安裝: 新建一個soft文件夾用於存放下載的軟件文件
- 可視化界面中右鍵可以創建新文件夾(也可以使用mkdir命令),我的軟件安裝文件都存在/home/sl/soft中,數據和軟件都存在/data/sl/中
- MobaXterm重新連接服務器,這時候命令輸入前多了一個base,說明conda已經在環境變量中,可以使用conda命令。
- 查看已安裝的包
- 其中看到Python版本
4 配置虛擬環境
1.創建虛擬環境
2. 虛擬環境中安裝第三方包
- 方法一:conda install package_name
- 方法二:pip安裝,例如安裝opencv
5 安裝PyTorch
- 官網選擇對應命令
- 在虛擬環境中安裝
- 注意: 使用conda命令安裝PyTorch會自動安裝對應cuda版本
cuda版本與顯卡驅動版本對應
如果不需要使用ncvv命令,安裝PyTorch或者tenserflow后也可以使用GPU加速。
6 配置cuda
方法1 使用Root下Cuda
- 查看cuda是否安裝,-> 沒有安裝
- 查找Root下cuda安裝位置
- 配置自己用戶下的環境變量,使用MobaXterm工具可以雙擊打開文件編輯器
- 復制以下內容到文件末端
# cuda
export CUDA_HOME=/usr/local/cuda-10.0
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-10.0/bin:$PATH
# cuda
- 關閉MobaTextEditor后會詢問是否保存到服務器,選擇保存。
- 查看結果
至此,已經完成了基本環境的配置,已經可以正常使用GPU計算資源。
方法2 非Root用戶安裝cuda
- 回到base環境中
- 查看Linux信息,並記住這些信息
- CUDA下載地址
- 下載完成
- 安裝過程
- 取消其他安裝項目,只安裝CUDA Toolkit
- 進入options,修改Toolkit Options
- 修改Library install path
- 完成后安裝
- 安裝成功顯示
- 更改環境變量使用新安裝的10.2版本,一下內容添加到.bashrc
# cuda
export CUDA_HOME=/data/sl/cuda-10.2
export LD_LIBRARY_PATH=/data/sl/cuda-10.2/lib/lib64:$LD_LIBRARY_PATH
export PATH=/data/sl/cuda-10.2/bin:$PATH
# cuda
- 使用source ~/.bashrc命令刷新配置文件,或重新登錄服務器
7 配置cudnn
- 注冊一個Nvidia賬戶
- 下載對應版本
- 右鍵復制下載地址,然后在服務器中下載
- 下載完成
-
解壓下載包
下載后文件名很長的后綴的話,先修改文件名為xx.tgz
-
cudnn安裝
- 按照自己目錄復制文件
- 修改對應權限
參考