查看GPU型號:
lspci | grep -i nvidia
驅動安裝:
https://www.nvidia.cn/Download/index.aspx?lang=cn
下載對應版本的驅動驅動程序;
安裝 gcc, g++, make 最新版本程序;
安裝 ubuntu 32 位兼容庫;
運行 .run 文件進行安裝;閱讀其中提示的信息並進行安裝,注意 網上有的博客提示暫時不要安裝 opengl,但是其中有坑,我剛開始不安裝opengl 的時候opengl 相關的功能不能使用;最后還是重新進行安裝了;
./nvidiainstaller.run (--no-opengl-files :此選項根據具體環境可選,建議不添加此選項進行完整安裝,如果你只使用 顯卡做機器學習可以添加上此選項不安裝opengl)
重新啟動后,查看 nvidia-settings 是否能夠運行,並檢查運行信息;
cuda 安裝:
注意對應版本來安裝;
./cuda-installer.run
安裝過后,記得添加環境變量:
vi ~/.bashrc
在文件末尾添加
export PATH="/usr/local/cuda-10.1/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH"
最后使其生效
source ~/.bashrc
安裝驅動和cuda后,執行測試例程,檢測環境是否安裝成功:
/usr/local/cuda-10.1/samples/1_Utilities/deviceQuery cuda sample 中,進行使用 make編譯並運行。執行結束后,顯示通過表示cuda安裝成功;
詳細安裝教程,請參考網友文章:https://www.cnblogs.com/zmbreathing/p/CUDA.html ,我已經進行驗證,安裝過程沒問題;
顯卡驅動卸載:
./NVIDIA-Linux-x86_64-435.21.run --uninstall
可等待機器重啟過后,重新進行安裝顯卡驅動;
保持更新,如果對您有幫助,請關注 cnblogs.com/xuyaowen,獲得更多信息;
# 查看GPU 拓撲:2019年11月10日
nvidia-smi topo --matrix

GPU0 CPU Affinity GPU0 X 0-13,28-41 Legend: X = Self SYS = Connection traversing PCIe as well as the SMP interconnect between NUMA nodes (e.g., QPI/UPI) NODE = Connection traversing PCIe as well as the interconnect between PCIe Host Bridges within a NUMA node PHB = Connection traversing PCIe as well as a PCIe Host Bridge (typically the CPU) PXB = Connection traversing multiple PCIe switches (without traversing the PCIe Host Bridge) PIX = Connection traversing a single PCIe switch NV# = Connection traversing a bonded set of # NVLinks
GPU NCCL Multi-GPU多卡通信框架相關:
https://www.cnblogs.com/xuyaowen/p/nccl-learning.html
nvidia 命令使用: