選擇哪個版本的CUDA


參考的https://zj-image-processing.readthedocs.io/zh_CN/latest/pytorch/cuda/%E5%AE%89%E8%A3%85%E5%93%AA%E4%B8%AA%E7%89%88%E6%9C%AC%E7%9A%84CUDA/

  1. 問題
    最近在做課程的綜合設計,方向是nlp,打算搞一下中文文本摘要相關的內容,想着跑一下https://github.com/qingkongzhiqian/GPT2-Summary這個例子,裝好環境后,一直報“段錯誤(核心已轉儲)”之類的錯誤,一開始還以為是自己的顯卡太拉跨了。。。沒想到是CUDA版本出了問題。。
  2. 解決辦法
    裝正確版本的CUDA!
  3. 版本選擇
    在終端輸入
    nvcc --version

可以看到CUDA版本為10.2,所以對應的
conda install pytorch torchvision cudatoolkit=10.2 -c pytorch
需要安裝10.2版本的cudatoolkit。
最后果然跑通了模型!!!
4. 最后說一下CUDA的兩個版本

可以看到nvcc -v 和 nvidia-smi 兩個對應的CUDA版本並不一樣,其實是因為CUDA 有兩種API,分別是 運行時 API 和 驅動API,即所謂的 Runtime API 與 Driver API。 nvidia-smi 的結果除了有 GPU 驅動版本型號,還有 CUDA Driver API的型號,這里是 10.0。而nvcc的結果是對應 CUDA Runtime API。
而我們安裝的時候,要和nvcc的保持一致。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM