-
開機
開啟集群前首先把所有集群的電腦打開並把電腦的網絡防火牆軟件等關掉,這些電腦必須安裝統一版本的Matlab,在此以Matlab 2016a為例進行說明。
-
每台電腦開啟集群配置文件
集群配置文件在matlab安裝目錄下,具體位置為:
C:\Program Files\MATLAB\R2016a\toolbox\distcomp\bin
在該目錄下首先打開addMatlabToWindowsFirewall.bat文件(右鍵管理員權限運行)
然后再打開admincenter.bat(右鍵管理員權限運行)
要是電腦多的話最好把這兩個文件的快捷方式發送到桌面以便后面每次方便運行。
-
集群聯機
集群的每台機器都添加一下所有IP:
實際上若只有一個Matlab Job Scheduler (MJS),僅在一台主機上添加所有主機即可,其它主機僅需添加本機IP。每台機器添加所有IP的好處還有每台電腦都能看到IP地址及對應電腦名稱,方便多台電腦的調試。聯機成功后如下圖所示:
之后,建立Matlab Job Scheduler (MJS),點擊MJS一欄左邊的Start,開始建立MJS:
需要注意的是,MJS可以建立在不同的主機上,可以在任何一個機子上設置其它電腦為MJS主機。MJS實際上相當於可以建立多個"分管集群",一台電腦可以受幾個不同的MJS控制。最后,建立Workers,在Workers一欄點左側的Start:
在這里可以具體定義每個MJS分配哪幾個電腦的多少個核心。這里每個選項要仔細設置,一旦完成定義workers再修改會很麻煩,需要destroy掉所有的workers然后重新定義。需要注意的是,若一個電腦同時歸兩個MJS管,需要確保內存充足,因為每個workers空載也是要占內存的。
-
Matlab Parallel Pool設置
首先打開左下角的Parallel preferences
然后打開Cluster Profile Manager
然后依次點Discover Clusters和On your network:
再在搜索到的MJS中選一個即可
最后打開Parallel Pool就可以享受集群火箭速度了
上一張結合29台4核電腦116核集群:
PS:
在我這個版本的集群中有可能出現Destroy掉workers后電腦藍屏,不知道這是不是個Matlab中的bug。如果出現掉線情況,在本電腦上重啟一遍程序或直接重啟電腦,然后重復一遍步驟1,2,會自動連入集群;或者可以嘗試右鍵Start mdce。