Failed to initialize NVML: GPU access blocked by the operating system


記錄問題:

昨天新到一批GPU (N卡),M40 + M60 + M6 + M4

使用nvidia-smi看不到的 product-name,亦即,那一項顯示的內容為ERR!

但是其他的部分內容,例如nivdia-smi -d CLOCK什么的都是可以查看的,

確診:驅動版本太低;

解決:升級驅動;

在  http://www.nvidia.com/download/driverResults.aspx/97645/en-us 這里下載驅動,注意的是,雖然這里有tesla和geforce的區別,但是

下載下來發現,同一時間節點的驅動,幾乎都是一致的,至少我驗證了quadro,tesla以及geforce,在2016.1.25這一批的驅動,md5都是相同的;

接下來就是安裝咯

 

現在N卡的驅動安裝,按照手冊中給出的方式一般就輕松搞定了 (LINK 戳),

需要注意的是,在這種傻瓜式的方法當中,注意runlevel的影響;我就是踩到這個坑了:

  1,自己使用terminal遠程ssh登錄過去,然后基於.run 文件進行安裝,一路無異常,但是安裝完后,沒有nvidia-xconfig的配置跳出,當時也沒多注意,

但是之后再使用nvidia-smi以及運行程序的時候,就報出標題錯誤或者 no available devices

  2,所以,在機器tty下執行: alt+F4 (或者alt+F5,F6也可以),進入tty,在這里的runlevel默認是3,安裝驅動一路無話,最后會蹦出xconfig,完成這一

步驟之后,驅動從當前的352.39 升級到了 352.79;tesla M-class的設備都可以正常使用了。。。。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM