选择哪个版本的CUDA


参考的https://zj-image-processing.readthedocs.io/zh_CN/latest/pytorch/cuda/%E5%AE%89%E8%A3%85%E5%93%AA%E4%B8%AA%E7%89%88%E6%9C%AC%E7%9A%84CUDA/

  1. 问题
    最近在做课程的综合设计,方向是nlp,打算搞一下中文文本摘要相关的内容,想着跑一下https://github.com/qingkongzhiqian/GPT2-Summary这个例子,装好环境后,一直报“段错误(核心已转储)”之类的错误,一开始还以为是自己的显卡太拉跨了。。。没想到是CUDA版本出了问题。。
  2. 解决办法
    装正确版本的CUDA!
  3. 版本选择
    在终端输入
    nvcc --version

可以看到CUDA版本为10.2,所以对应的
conda install pytorch torchvision cudatoolkit=10.2 -c pytorch
需要安装10.2版本的cudatoolkit。
最后果然跑通了模型!!!
4. 最后说一下CUDA的两个版本

可以看到nvcc -v 和 nvidia-smi 两个对应的CUDA版本并不一样,其实是因为CUDA 有两种API,分别是 运行时 API 和 驱动API,即所谓的 Runtime API 与 Driver API。 nvidia-smi 的结果除了有 GPU 驱动版本型号,还有 CUDA Driver API的型号,这里是 10.0。而nvcc的结果是对应 CUDA Runtime API。
而我们安装的时候,要和nvcc的保持一致。


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM