轉載請注明出處:
http://www.cnblogs.com/darkknightzh/p/6606092.html
參考網址:
https://github.com/tensorflow/tensorflow/issues/6509#issuecomment-277882893
說明:不確定是否還有其他原因。我這邊是這樣解決的。
具體錯誤如下:
tensorflow/stream_executor/cuda/cuda_driver.cc:1185] failed to enqueue async memcpy from host to device: CUDA_ERROR_LAUNCH_FAILED tensorflow/stream_executor/cuda/cuda_driver.cc:49] Erroe polling for event status: failed to query enent: CUDA_ERROR_LAUNCH_FAILED tensorflow/core/common_runtime/gpu/gpu_event_mgr.cc203] Unexpected event status: 1 Aborted (core dumped)
這個不太確定具體都是什么原因,但是我這邊tensorflow程序運行了幾次,每次運行一段時間后,就提示上面的問題。后來看參考網址上DIPRECXY說,更新cudnn5.1(雖然問題不一樣,但是我這邊確實解決了)。更新了之后,運行了一段時間,確實沒有出現上面的錯誤。
順便,torch7中運行程序也崩潰(以前沒有出現過),更新了之后,也沒再崩潰。
因而猜測,可能是之前cuda使用的是7.5的,然后cudnn也是配套的5.0還是哪個版本。前幾天改成了cuda8.0,但是cudnn沒有更新。因而程序運行一段時間之后,就崩潰。改成了配套的cudnn之后,就可以了。
