- 问题
最近在做课程的综合设计,方向是nlp,打算搞一下中文文本摘要相关的内容,想着跑一下https://github.com/qingkongzhiqian/GPT2-Summary这个例子,装好环境后,一直报“段错误(核心已转储)”之类的错误,一开始还以为是自己的显卡太拉跨了。。。没想到是CUDA版本出了问题。。 - 解决办法
装正确版本的CUDA! - 版本选择
在终端输入
nvcc --version
可以看到CUDA版本为10.2,所以对应的
conda install pytorch torchvision cudatoolkit=10.2 -c pytorch
需要安装10.2版本的cudatoolkit。
最后果然跑通了模型!!!
4. 最后说一下CUDA的两个版本
可以看到nvcc -v 和 nvidia-smi 两个对应的CUDA版本并不一样,其实是因为CUDA 有两种API,分别是 运行时 API 和 驱动API,即所谓的 Runtime API 与 Driver API。 nvidia-smi 的结果除了有 GPU 驱动版本型号,还有 CUDA Driver API的型号,这里是 10.0。而nvcc的结果是对应 CUDA Runtime API。
而我们安装的时候,要和nvcc的保持一致。