Unable to determine the device handle for GPU 0000:01:00.0: GPU is lost.問題排坑


在運行maskrcnn時,會碰到訓練不動的問題,就卡在這兒

UserWarning: Converting sparse IndexedSlices to a dense Tensor of unknown shape. This may consume a large amount of memory.
  "Converting sparse IndexedSlices to a dense Tensor of unknown shape. "
Epoch 1/10
image_id 31

  然后根據一些博主建議,用最新的mrcnn代碼代碼試了試,這回會報錯了

Failed to get device properties, error code: 30

然后用nvidia-smi在cmd試了試,果然GPU又掛了,之前就一直出現GPU訓練一次后會掛掉,必須重啟電腦才行

Unable to determine the device handle for GPU 0000:01:00.0: GPU is lost.

查詢一些博客才知道可能是CUDA版本和驅動問題,我覺得我CUDA應該沒問題,用的9.2版本,那就改驅動吧

把驅動更新退回上一次更新的版本就可以正常運行了,這么一個小問題花了三天時間,都是淚啊,主要是碰到這個問題的人太少了。退回后我的顯卡驅動版本是398.27

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM