CUDA運行時錯誤 --- CUDA_ERROR_LAUNCH_FAILED: unspecified launch failure


錯誤信息:

2020-04-08 11:01:43.783914: E tensorflow/stream_executor/cuda/cuda_event.cc:29] Error polling for event status: failed to query event: CUDA_ERROR_LAUNCH_FAILED: unspecified launch failure
2020-04-08 11:01:43.791497: F tensorflow/core/common_runtime/gpu/gpu_event_mgr.cc:273] Unexpected Event status: 1

====================================================================================

問題綜述:

1、這是一個暫時性的問題,一般情況下這說明你的機器是沒問題的。這個問題出現在機器高負荷運行幾個小時后,這就告訴你可能是gpu運算出錯了,這不是一個永久性的問題

2、這類錯誤或許是因為人工智能第五星座的宇宙奇異伽馬射線,穿過CPU, 無意中造成的,或者是絕少發生的硬件錯誤引起的,或者是因為電壓不穩,時鍾頻率異常,溫度造成的cpu運行錯誤

3、來自人工智能星球中一名園丁的解釋:我遇到了同樣的問題並提交給了NVIDIA,他們說這個問題是運行時間超過5s造成的,請查看windows的發行說明

====================================================================================

注意事項:

個人gpu程序運行被系統限制在5s之內完成,超過這個時間cuda驅動或cuda運行時通常會引發運行失敗,有時候會整個機器都會沒有反應,有時也會藍屏,須重啟。

微軟的windows系統有一個看門狗讓程序使用初級圖形適配器控制超時。

處於這種考慮,建議cuda運行在沒有跟顯示器連接的而且非windows桌面環境下的G80顯卡上

因此,系統必須還要有至少一個NVIDIA gpu作為初級圖形適配器

====================================================================================

結束。。。。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM