常用命令介紹
對VCS的常用命令進行介紹,便於工程師進行日常維護。本手冊描述的命令僅供參考,具體描述請以Veritas公司提供的相關資料為准。
VCS的安裝和命令都在下列目錄下:sbin, /usr/sbin, /opt/VRTS/bin,和/opt/VRTSvcs/bin
,如果沒有設置VCS的環境變量,請在/etc/profile文件中增加藍色信息PATH=/opt/VRTSvcs/bin :/sbin:/usr/sbin:/usr/local/sbin:$PATH
修改完畢后需執行source /etc/profile,或者重新登陸。
1.1 基本命令
使用/etc/rc.d/llt {start|stop|restart|condrestart|status}命令可以啟動、停止、重啟llt及查看llt狀態;
使用/etc/rc.d/gab{start|stop|restart|condrestart|status}命令可以啟動、停止、重啟gab及查看gab狀態;
使用/etc/rc.d/vcs {start|stop|restart|condrestart|status}命令可以啟動、停止、重啟VCS及查看VCS狀態;也可使用hastart [-stale|-force]來啟動VCS;
使用下列命令來查看集群狀態:hastatus或者hastat -sum
啟動單節點集群:hastart –onenode
以時間共享方式啟動VCS:hastart –ts
關閉整個集群服務:hastop -all [-force]
關閉集群中一台主機上的集群服務:hastop -local
只關閉VCS相關進程,而不停止VCS所保護的服務進程:hastop -sys system [-force | -evacuate]
使配置文件可讀寫:haconf –makerw
使配置文件只讀:haconf -dump –makero
1.2 VCS的用戶管理:
增加用戶,用戶默認有觀察員身份:hauser -add user
將用戶提升為集群管理員:haclus -modify Administrators -add user
將用戶提升為集群操作員:haclus -modify Operators -add user;
將用戶提升為服務組管理員:hagrp -modify service_group Adminstrators -add user
將用戶提升為服務組操作員:hagrp -modify service_group Operators -add user
刪除用戶:hauser -delete user
顯示所有用戶:hauser -display
查詢集群日志:
hamsg -list
hamsg -info [-path path_name] LDF
1.3 對服務組的基本管理操作:
查詢service_group狀態:hagrp -state [service_group] -sys [system];
查詢節點之間依賴關系:hagrp -dep [service_group]
查詢資源表:
hagrp -resources [service_group] ;
hagrp -display [service_group] [-attribute attribute] [-sys system]
hares -display [resource]
hares -display -attribute [attribute]
hares -display -group [service_group]
hares -display -type [resource_type]
hares -display -sys [system]
啟動服務組及使服務聯機:hagrp –online service_group –sys system
關閉服務組及使服務脫機:hagrp –offline service_group –sys system
將服務組切換到另一個系統上:(只對failover組有效,且當服務組中服務部分或全部聯機時):
hagrp -switch service_group -to system
凍結服務組(disable onlining, offlining, and failover),option -persistent 是使cluster重啟時freeze:
hagrp -freeze service_group [-persistent]
解凍被凍結的服務組 (reenable onlining, offlining, and failover)
hagrp -unfreeze service_group [-persistent]
激活服務組:(服務組激活后才能進行聯機操作)hagrp -enable service_group [-sys system]
禁用服務組:(服務組禁用后不能進行聯機或切換操作)hagrp -disable service_group [-sys system]
激活服務組中資源:hagrp -enableresources service_group
禁用服務組中資源:(如資源為disable時agents不監控資源組)hagrp -disableresources service_group
清除故障狀態:hagrp -clear [service_group] -sys [system]
1.4 管理資源操作:
查詢資源代理列表:
hatype -list
hatype -resources resource_type
hatype -display [resource_type]
haagent -display [agent]
使資源聯機:hares -online resource -sys system
使資源脫機:hares -offline resource -sys system
使資源脫機並將命令傳播給子節點:hares -offprop resource -sys system
提示資源代理(agent)監控指定系統上的資源:(命令可能立即返回,但監控的進程可能還沒結束)hares -probe resource -sys system
清洗資源,使狀態從RESOURCE_FAULTED 轉為RESOURCE_OFFLINE:
hares -clear resource [-sys system]
1.5 管理主機:
查詢主機列表:
hasys -list
hasys -display [system]
haclus -value attribute
haclus –display
在ADMIN_WAIT狀態下強制主機加載集群,此命令會覆蓋正在使用的集群配置,使用前請確認准備使用的主機的集群配置文件是否有效:
hacf –verify /etc/VRTSvcs/conf/concig
hasys -force system
修改主機的屬性,一些屬性是VCS的內部屬性,不能修改:
hasys -modify modify_options
查詢主機ID,主機ID定義在文件/etc/llttab中:hasys –nodeid node_ID
凍結主機 (防止主機進行聯機或切換操作):hasys -freeze [-persistent] [-evacuate] system
解凍被凍結的主機 (使主機可以進行聯機或切換操作):hasys -unfreeze [-persistent] system
1.6 VCS的license的管理操作:
安裝VCS的License(root用戶下執行):halic <key>或者vxlicinst –k <key>
查詢license:vxlicrep
2 使用圖形界面管理VCS
使用圖形界面來管理VCS,必須保證VCS已經啟動,否則不能訪問,如果在本機上使用圖形界面管理VCS,必須保證VCS圖形界面的rpm包已經安裝好了,使用rpm –qa |grep VRTS查詢,結果中存在以下兩個rpm包則說明可以使用
VRTSjre-1.4-GA1
VRTScscm-4.4.00.10-GA_GENERIC
如果是在window終端上使用圖形界面,在光盤中找到/windows/WindowsClusterManager這個目錄,點擊安裝,按照提示完成安裝,安裝完成之后直接可以使用。
2.1 登錄Cluster Manager
2.1.1 啟動Cluster Manager
Cluster Manager有兩種版本:Windows版本和Linux版本。建議使用Windows版本來遠程管理Cluster。Windows版本安裝后通過開始菜單或者桌面圖標即可啟動。
Linux版本啟動方式如下:
啟動圖形界面的Veritas Cluster Monitor
# hagui &
啟動后將顯示Cluster Monitor界面

圖1 啟動Cluster Monitor界面
第一次登陸,Cluster Monitor界面上可能沒有上圖中的cluster_HA-test,需要新增一個要管理的Cluster:點擊Cluster Monitor的File->New Cluster菜單,會出來如下界面:

圖2 在cluter monitor中增加cluster的界面
其中Host name使用任一接點的IP即可,Port使用缺省值。
增加要管理的cluster后,Cluster Monitor中就會出現如圖1中的cluster列表,顯示為未登陸狀態,點擊Cluster Monitor中的cluster列表區,將彈出登陸界面,如下圖所示:

圖3 登陸界面
輸入用戶名和密碼(默認情況下用戶為admin,密碼為password),點擊OK。
| 編號 |
問題描述 |
解決辦法 |
| 1 |
重啟機器后,需要重新start llt,gab.機器reboot之后,gab異常: # lsmod |grep gab gab 253244 0 llt 139680 0 [gab] |
這個是SuSe linux 8操作系統默認不加載網卡驅動導致的問題。解決辦法: 在文件 /etc/modules.conf中加入如下內容,ethX對應具體的心跳網卡 alias ethX e1000 |
| 2 |
在/etc/modules.conf文件中添加了“alias eth5 e1000”之后,心跳線使用正常;但如果用戶使用yast配置其他網卡的IP,eth5將不可用,系統顯示eth5的驅動沒有加載 |
因為yast配置網卡時會將沒有配置文件的網卡去激活,要確保yast對心跳線無影響,必須同時給心跳線網卡寫配置文件 在/etc/modules.conf文件中添加了“alias eth5 e1000”之后,同時給心跳線的網卡加入配置文件,在/etc/sysconfig/network/中加入ifcfg-ethX文件,內容如下: BOOTPROTO='static' STARTMODE='onboot' |
| 3 |
備用機與主服務器之間只有一條線跳線時,服務不會FailOver到備用機。有沒有參數可以控制? |
在集群中只剩下一條心跳線的情況下,如果LLT收不到心跳線信號,VCS將無法判斷是主機損壞還是僅是心跳線故障。所以在集群中只剩下一條心跳線的情況下,不會FailOver。 |
| 4 |
在提供服務組的主機上使用yast給其他網卡配置IP后,浮動IP會報錯,導致服務發生切換 |
因為yast配置網卡時會將沒有配置文件的網卡去激活,浮動IP是沒有配置文件的,所以會被yast干掉,導致浮動IP不可用,引發切換,這是yast的固有bug,只能避免使用yast配置網卡信息,如果需要配置,請直接修改網卡的配置文件 |
| 5 |
使用命令hastatus -sum 查看狀態是下面兩種狀態 STALE_ADMIN_WAIT: ADMIN_WAIT: |
在STALE_ADMIN_WAIT 和ADMIN_WAIT狀態下強制主機加載集群,此命令會覆蓋正在使用的集群配置,使用前請確認准備使用的主機的集群配置文件是否有效: hacf –verify /etc/VRTSvcs/conf/concig hasys -force system |
