報錯如下:
[20-4-11 17:42:48:264 CST] 0000000e RoleViewLeade I DCSV8030I: 在成員 vmu208119Cell01\vmu208119AppNode01\vmu208119expqr01 處的 DCS 堆棧 DefaultCoreGroup:無法加入或建立具有成員 [vmu208119Cell01\vm41283858node\nodeagent] 的視圖。原因是 Not all candidates are connected ConnectedSetMissing= [ ] ConnectedSetAdditional [ vmu208119Cell01\vmu208123AppNode01\vmu208123expqr01 ]
同步概念:
在IBM WAS ND產品中,管理配置數據都存儲在 XML 文件中。單元保留了它每個節點中每台服務器的主配置文件。同時每個節點和服務器也有其自己的本地配置文件。如果服務器已經屬於單元,則對於本地節點或服務器配置文件的更改都是臨時的,通過在本地提交更改生效時,本地更改覆蓋單元配置,但是當執行單元配置文檔同步到節點的操作時,在單元級別上對主控服務器和主節點配置文件所作的更改將會替換對該節點所作的任何臨時更改。
同步操作在指定的事件發生時進行,如啟動server或者停止server的時候,以及在修改了應用程序服務器配置、更新了應用程序及其他情況。
節點不同步現象:
在管理控制台,節點的狀態顯示未同步狀態;
在管理控制台修改了配置,保存的時候,無法同步到各個節點及單元;
管理控制台中顯示的server狀態異常且無法啟停server或者啟停異常;
集群中部分server的啟停異常,且訪問該server上的應用異常;
節點后台日志有關於“憑證”“管理員”等字眼的報錯日志;
管理控制台啟停異常;
管理控制台和節點日志有某個節點節點成員被懷疑的報錯;
其他現象待補充;
節點不同步原因:
服務器異常斷電;
各個節點及dmgr所在服務器的系統時間誤差超過3分鍾;
非法操作,如啟停server的時候,反復啟停;
強制結束server、node的進程;
增加或者修改了WAS管理控制台的密碼;
修改了/etc/hosts文件;
各個節點所在服務器的主機名有沖突;
增加或者刪除了WAS的節點后沒及時同步;
其他原因待補充;
解決方法:
禁用全局安全性;
停止節點,在命令行下做全部再同步;
啟動節點,啟用全局安全性;
停止節點,做全部再同步;
備注:禁用安全性,可以在管理控制台全局安全性里取消,也可以在配置文件security.xml中將大約第三行的位置“enable=true”改成“false”;
命令行同步命令:./syncNode.sh dmgr_host 8879
故障現象:管理控制台無法同步未同步的節點,直接導致該節點上的server啟動失敗或者異常。
故障原因:服務器異常斷電,或者在命令強行結束WAS進程都可能導致節點無法同步。
故障分析:啟動節點,查看 SystemOut.log,報錯如下:
SECJ0305I: 對於 admin-authz 操作 JVM,基於角色的授權檢查失敗:getCurren
tTimeInMillis。用戶 UNAUTHENTICATED(唯一標識:unauthenticated)未被授予下列任何必需角色:adminsecuritymanager, administrator, monitor, configurator, operator, deployer。
ADMS0036E: 配置同步失敗。
處理思路:
1. 禁用全局安全性(即去掉訪問控制台的密碼),重啟dmgr;
2. 停止所有節點;
3. 進到節點的bin目錄下,做手動強制同步;
4. 啟用全局安全性並重啟dmgr和所有節點;
5. 登陸管理控制台做全部再同步;
6. 如果上一步做完還是不能同步,停止所有節點,到命令行下做手動強制同步;
7. 重啟dmgr,啟動節點。
處理過程:
1、編輯/opt/IBM/WebSphere/AppServer/profiles/Dmgr01/config/cells/app1Cell01/security.xml
將第三行useLocalSecurityServer="true" useDomainQualifiedUserNames="false" enabled="true"
中的enabled="true"改為enabled="false"
或登陸管理控制台,導航到安全性,安全管理、應用程序和基礎結構,將啟用管理安全性前的勾去掉
2、然后重啟dmgr服務,並停止所有節點服務;
3、停止所有節點服務
/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/bin/stopNode.sh
4、做手動強制同步
./syncNode.sh dmgr_hostname 8879
5、啟用全局安全性,並重啟dmgr和所有節點
/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/bin/startNode.sh
6、登陸管理控制台,依次點擊系統管理,節點,選擇所有節點,點擊全部再同步;
7、停止所有節點,到命令行下做手動全部再同步(建議每個節點都做)
./syncNode.sh dmgr_hostname 8879 -username wasadmin -password *****
8、重啟dmgr和所有節