- 問題
最近在做課程的綜合設計,方向是nlp,打算搞一下中文文本摘要相關的內容,想着跑一下https://github.com/qingkongzhiqian/GPT2-Summary這個例子,裝好環境后,一直報“段錯誤(核心已轉儲)”之類的錯誤,一開始還以為是自己的顯卡太拉跨了。。。沒想到是CUDA版本出了問題。。 - 解決辦法
裝正確版本的CUDA! - 版本選擇
在終端輸入
nvcc --version
可以看到CUDA版本為10.2,所以對應的
conda install pytorch torchvision cudatoolkit=10.2 -c pytorch
需要安裝10.2版本的cudatoolkit。
最后果然跑通了模型!!!
4. 最后說一下CUDA的兩個版本
可以看到nvcc -v 和 nvidia-smi 兩個對應的CUDA版本並不一樣,其實是因為CUDA 有兩種API,分別是 運行時 API 和 驅動API,即所謂的 Runtime API 與 Driver API。 nvidia-smi 的結果除了有 GPU 驅動版本型號,還有 CUDA Driver API的型號,這里是 10.0。而nvcc的結果是對應 CUDA Runtime API。
而我們安裝的時候,要和nvcc的保持一致。