NVIDIA HPC SDK提供了使用標准的C/C++和Fortran的編譯器以及OpenACC指令和CUDA實現HPC建模和模擬應用的GPU加速。此工具能夠讓代碼人員對源代碼進行快速移植、並行和優化GPU加速,可以更大限度地提高科學和工程吞吐量,更大限度地減少編碼時間。NVIDIA HPC SDK是免費軟件。(請注意免費軟件、開源軟件和自由軟件的區別)
我自己需要NVIDIA HPC SDK中提供的工具包括:(以下工具在CUDA Toolkit中可能不提供)
(1) PGI Fortran編譯器
(2) cuBLAS、cuSOLVER等GPU並行數學函數庫
(3) Nsight 性能分析器
(4) OpenACC支持
(5) 多GPU並行支持
目前,PGI Fortran編譯器已經並入NVIDIA HPC SDK,所以必須使用NVIDIA HPC SDK才能使用CUDA Fortran語言。NVIDIA HPC SDK不提供Windows版本,只能在Linux下安裝和使用。最后一個Windows版本的PGI Fortran編譯器是19.10,官網已經不再提供,但是如果購買商業使用的話應該還是可以下載到的。
如果需要下載安裝文件進行本地安裝,則進入NVIDIA HPC SDK下載地址:(可能會有更改)
https://developer.nvidia.com/nvidia-hpc-sdk-downloads
提醒注意:Nvidia CUDA HPCSDK中包含了CUDA Toolkit,因此如果需要安裝HPC SDK,則不再需要單獨安裝CUDA Toolkit。CUDA Toolkit會在安裝路徑中的/opt/nvidia/hpc_sdk/Linux_x86_64/22.x/cuda (22.x是版本號)
在接受許可協議后,在處理器平台中選擇Linux x86_64,可以選擇是與最新版本的CUDA Toolkit合集,或者額外包含前兩個版本的CUDA Toolkit合集。此處建議選擇最新版本合集即可。
選擇分發版本,如果選擇Linux x86_64 Tarball,即下載后解壓再本地安裝。如果是Ubuntu系統,建議選擇Linux x86_64 DEB,加入軟件源后直接在線安裝,經測試,在線安裝的方式要更簡單。
點擊Linux x86_64 DEB后,按照網頁指引,輸入終端,等待安裝完成。提醒注意:建議取消BIOS中的Security Boot選項。
安裝完成后,終端輸入”nvc -V“,會發現找不到命令,因為需要配置環境變量(Linux裝軟件幾乎都需要配置環境變量)。配置環境變量的方法可以打開下載頁面的Documentation,在Installation Guide中查看,或者
打開環境變量文件(vim用法略過):
vim ~/.bashrc
輸入
NVARCH=`uname -s`_`uname -m`; export NVARCH NVCOMPILERS=/opt/nvidia/hpc_sdk; export NVCOMPILERS MANPATH=$MANPATH:$NVCOMPILERS/$NVARCH/22.5/compilers/man; export MANPATH PATH=$NVCOMPILERS/$NVARCH/22.5/compilers/bin:$PATH; export PATH
提醒注意:如果終端命令nvcc -V無反應,則CUDA及CUDA庫仍然需要單獨指定
使環境變量生效
source ~/.bashrc
其中,22.5為版本號,需要替換為安裝時使用的版本號x.x。
完成環境變量配置后,在終端輸入命令”nvc -V“會出現對應編譯器的版本號。NVIDIA HPC SDK安裝完成,已經可以開始使用了!
另外,以上步驟在WSL 2中同樣適用,雖然第一次安裝WSL2時可能已經安裝了Nvidia顯卡驅動,但是如果有硬件更改,可能需要提前安裝對應的nvidia GPU driver。
