今天收到redis的keepalived vip無法ping通的告警,查看服務器和服務時發現vip在服務器上,服務也正常。只能在本機ping通,跨網段無法ping通。切換keepalived vip至slave后恢復,但是在切回master后過了一會又無法ping通。
故障原因:
一、keepalived和redis軟件問題
1、登錄master發現vip在服務器上正常,slave無vip,但是跨網段無法ping通,keepalived服務正常
2、查看tcpdump抓包,未發現有vrid相同的情況,如果相同從日志也能看出
tcpdump -i eth0 vrrp -n
二、服務器問題
1、防火牆關閉狀態
2、selinux關閉
3、服務器所在雲平台管理員反饋服務器正常
三、網絡問題
1、網管反饋網絡正常
2、有點懷疑是apr綁定的問題了,於是清理該vip的arp綁定
組合命令清楚所有arp緩存: arp -n|awk '/^[1-9]/{system("arp -d "$1)}'

先清理master的arp,將vip切回至master,ping vip正常
再清理slave的arp
參考
keepalived vip 不能ping通!-qingheliu-ChinaUnix博客 http://blog.chinaunix.net/uid-20776139-id-5139371.html
linux 清除 arp 緩存 - Gino的專欄 - CSDN博客 https://blog.csdn.net/u011641885/article/details/48175239
Linux VIP(虛擬IP)配置后,無法ping通的問題處理 - 自慎 - CSDN博客 https://blog.csdn.net/zhang_shufeng/article/details/37930405
