在互聯網高速發展的今天,尤其在電子商務的發展,要求服務器能夠提供不間斷服務。在電子商務中,如果服務器宕機,造成的損失是不可估量的。要保證服務器不間斷服務,就需要對服務器實現冗余。在眾多的實現服務器冗余的解決方案中,Pacemaker為我們提供了廉價的、可伸縮的高可用解決方案。
雙機熱備測試環境如下:
主節點:10.0.0.20 副節點:10.0.0.21 虛擬IP:10.0.0.100
一、關閉selinux和防火牆-兩台機均執行
1、 關閉selinux
$ sudo sed -i “s/SELINUX=enforcing/SELINUX=disabled/g” /etc/selinux/config $ sudo reboot
2、 閉防火牆
$ sudo systemctl stop firewalld $ sudo systemctl disable firewalld
二、兩台機安裝Pacamaker
1、 利用yum安裝Pacemaker
$ sudo yum install -y fence-agents-all corosync pacemaker pcs
2、 修改兩台機的hostname
#主節點改為node1 $ sudo hostnamectl set-hostname node1 #副節點 $ sudo hostnamectl set-hostname node2
3、 修改兩台機的hosts
$ sudo vim /etc/hosts 10.0.0.20 node1 10.0.0.21 node2
三、node1與node2實現無密鑰訪問
#在兩台機均運行以下命令 $ sudo -i # ssh-keygen # ssh-copy-id -p 22 root@10.0.0.20 # ssh-copy-id -p 22 root@10.0.0.21
四、配置兩台機的集群用戶hacluster,此帳戶在安裝Pacemaker時已經自動創建。
#設置hacluster用戶的密碼 $ sudo passwd hacluster
五、配置集群節點之間的認證
1、 啟動並設置開機啟動pcsd服務,兩台機上均執行以下命令
$ sudo systemctl start pcsd $ sudo systemctl enable pcsd
2、 配置節點間的認證,以下命令只在node1節點上執行
#以下操作需要輸入用戶名hacluster和密碼 $ sudo pcs cluster auth node1 node2
到此為止,節點認證配置完成!
六、Pacemaker可以為多種服務提供支持,例如Apache、MySQL、Xen等,可使用的類型有IP地址、文件系統、服務、fence設備等。以下以Apache為例。
1、 兩台機均安裝httpd
$ sudo yum install -y httpd
2、 設置httpd.conf-兩台主機均配置
$ sudo vim /etc/httpd/conf/httpd.conf Listen 0.0.0.0:80 ServerName www.node1.com //另外一台為www.node2.coom #設置服務器狀態頁面以便集群檢測 <Location /server-status> SetHandler server-status Require all granted </Location>
3、Pacemaker可以控制httpd服務的啟動和關閉,所以node1和node2配置完httpd后需關閉httpd服務。
$ sudo systemctl stop httpd
七、 新建並啟動集群,以下操作均在node1上執行
1、 新建一個名為mycluster的集群
$ sudo pcs cluster setup --name mycluster node1 node2
2、 啟動集群
$ sudo pcs cluster start --all
3、 設置自啟動集群
$ sudo pcs cluster enable –all # 查看集群狀態 $ sudo pcs status
通過以上在node1的設置后,所有的設置都會同步在node2上。
八、為集群添加資源
#添加一個名為VIP的IP地址資源 #使用heartbeat作為心跳檢測 #集群每隔30s檢查該資源一次 $ sudo pcs resource create VIP ocf:heartbeat:IPaddr2 ip=10.0.0.100 cidr_netmask=24 op monitor interval=30s $ sudo pcs resource create Web ocf:heartbeat:apache configfile=/etc/httpd/conf/httpd.conf statusurl="http://127.0.0.1/server-status" op monitor interval=30s $ sudo pcs status
九、調整資源,讓VIP和Web兩個資源“捆綁”在一起。
# 方式一:將VIP和Web添加到myweb組中 $ sudo pcs resource group add myweb VIP $ sudo pcs resource group add myweb Web # 方式二:使用托管約束 $ sudo pcs constraint colocation add Web VIP INFINITY # 設置先啟動VIP,再啟動Web $ sudo pcs constraint order start VIP then start Web
十、優先級:如果node1與node2的硬件配置不同,那么應該調整節點的優先級,讓資源運行於硬件配置更好的服務器上,待其失效后再轉移至較低配置的服務器上。這就需要配置優先級(Pacemaker中稱為Location)。
1、調整Location
# 數值越大表示優先級越高 $ sudo pcs constraint location Web prefers node1=10 $ sudo pcs constraint location Web prefers node2=5
2、查看設置結果
$ sudo crm_simulate -sL
3、驗證VIP是否啟用-需顯示IP10.0.0.100
$ ip addr show
4、驗證httpd是否啟動
$ ps -aux|grep httpd
5、報錯:WARNING: no stonith devices and stonith-enabled is not false,請執行以下命令:
$ sudo pcs property set stonith-enabled=false
十一、 啟動后正常情況下VIP設置在主節點10.0.0.20上。如主節點故障,則節點node2自動接管服務,方法是直接重啟節點node1,然后觀察備用節點是否接管了主機的資源,測試過程如下:
1、 在節點node1上執行重啟操作
#執行重啟 $ sudo reboot
2、node1重啟前截圖

3、node1重啟后狀態如下圖

4、當節點node1故障時,節點node2收不到心跳請求,超過設置的時間節點后node2啟用資源接管程序,上述命令輸出中說明VIP和Web已經被節點node2成功接管。如果節點node1恢復且設置了優先級,VIP和Web又會重新被節點node1接管。下圖為node1重啟后的截圖:

