RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方法


最近再用LSTM训练模型,有时候epoch进行几次后总会出现RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED,心态都快崩了。记录一下自己踩过的坑吧,上网查了一下这个报错,大家说法不一,有人说是因为pytorch和cuda版本不对应,得重新装一下,这个方法对我来说不适用。先去pytorch官网查了CUDNN,再去论坛逛了一圈,终于有点眉目鸟。

 

 官网上的介绍,简单来说cudnn是cuda的一个工具,专门用于加速深度网络。当然不用cudnn也可以,cuda也可以用其他工具加速,但是效果肯定没这么好。

在国内网站查了半天,也没找到解决报错的方法。训练RNN模型很容易出现这个bug,在这个网站,我找到了适合我的方法https://discuss.pytorch.org/t/cuda-error-runtimeerror-cudnn-status-execution-failed/17625

方法1:

方法2:加指令  torch.backends.cudnn.enabled=False,但是运行速度会变得很慢

 

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM