錯誤信息:
2020-04-08 11:01:43.783914: E tensorflow/stream_executor/cuda/cuda_event.cc:29] Error polling for event status: failed to query event: CUDA_ERROR_LAUNCH_FAILED: unspecified launch failure
2020-04-08 11:01:43.791497: F tensorflow/core/common_runtime/gpu/gpu_event_mgr.cc:273] Unexpected Event status: 1
====================================================================================
問題綜述:
1、這是一個暫時性的問題,一般情況下這說明你的機器是沒問題的。這個問題出現在機器高負荷運行幾個小時后,這就告訴你可能是gpu運算出錯了,這不是一個永久性的問題
2、這類錯誤或許是因為人工智能第五星座的宇宙奇異伽馬射線,穿過CPU, 無意中造成的,或者是絕少發生的硬件錯誤引起的,或者是因為電壓不穩,時鍾頻率異常,溫度造成的cpu運行錯誤
3、來自人工智能星球中一名園丁的解釋:我遇到了同樣的問題並提交給了NVIDIA,他們說這個問題是運行時間超過5s造成的,請查看windows的發行說明
====================================================================================
注意事項:
個人gpu程序運行被系統限制在5s之內完成,超過這個時間cuda驅動或cuda運行時通常會引發運行失敗,有時候會整個機器都會沒有反應,有時也會藍屏,須重啟。
微軟的windows系統有一個看門狗讓程序使用初級圖形適配器控制超時。
處於這種考慮,建議cuda運行在沒有跟顯示器連接的而且非windows桌面環境下的G80顯卡上
因此,系統必須還要有至少一個NVIDIA gpu作為初級圖形適配器
====================================================================================
結束。。。。