記錄問題:
昨天新到一批GPU (N卡),M40 + M60 + M6 + M4
使用nvidia-smi看不到的 product-name,亦即,那一項顯示的內容為ERR!
但是其他的部分內容,例如nivdia-smi -d CLOCK什么的都是可以查看的,
確診:驅動版本太低;
解決:升級驅動;
在 http://www.nvidia.com/download/driverResults.aspx/97645/en-us 這里下載驅動,注意的是,雖然這里有tesla和geforce的區別,但是
下載下來發現,同一時間節點的驅動,幾乎都是一致的,至少我驗證了quadro,tesla以及geforce,在2016.1.25這一批的驅動,md5都是相同的;
接下來就是安裝咯
現在N卡的驅動安裝,按照手冊中給出的方式一般就輕松搞定了 (LINK 戳),
需要注意的是,在這種傻瓜式的方法當中,注意runlevel的影響;我就是踩到這個坑了:
1,自己使用terminal遠程ssh登錄過去,然后基於.run 文件進行安裝,一路無異常,但是安裝完后,沒有nvidia-xconfig的配置跳出,當時也沒多注意,
但是之后再使用nvidia-smi以及運行程序的時候,就報出標題錯誤或者 no available devices
2,所以,在機器tty下執行: alt+F4 (或者alt+F5,F6也可以),進入tty,在這里的runlevel默認是3,安裝驅動一路無話,最后會蹦出xconfig,完成這一
步驟之后,驅動從當前的352.39 升級到了 352.79;tesla M-class的設備都可以正常使用了。。。。

