一、滾動發布介紹
滾動發布(rolling update)是最常見的一種發布模式。比如我有10台機器,一台一台的進行部署。每台機器進行部署時,需要保證沒有請求會派發到該機器,否則用戶就會看到502的錯誤。所以需要有一個“下線”的操作,把當前機器從負載均衡中摘除,然后在部署完成之后,再把自己掛回到負載均衡中,這個過程稱為“上線”。接下來會講解,配合阿里雲SLB如何做上線/下線操作。
二、SLB配置
配置SLB監聽端口:
創建虛擬服務器組:
配置健康檢查(很重要,可以在后端服務器上配置好nginx后再來配置):
相關說明:圖中的關鍵點:
- 健康檢查路徑,需要由實例上的web服務器提供,在本例中是
/nginx-status.html - 健康檢查間隔,配置為2S。
- 健康閾值,配置為2,也就說2次健康檢查失敗,則認為該后端服務器不可用。同樣的,兩次連續的健康檢查成功,就會認為該后端服務器可用。
- 按照這個配置,如果
/nginx-status.html這個URL不可用超過4S,則SLB會把該服務器摘除。在這4S內,應用服務仍需要是可用的,因為還會有請求派發過來。可以通過如下方式達到這個效果。
三、后端服務器配置
3.1、安裝應用服務
此服務以tomcat為例,兩台都需要安裝
3.2、配置nginx
yum安裝nginx參考文檔:https://www.cnblogs.com/songxingzhu/p/8568432.html
配置nginx並啟動:
[root@test-mysqldb ~]# vim /etc/nginx/conf.d/test.conf
server {
listen 80;
server_name localhost default;
location ~ ^/(nginx-status) {
root /usr/java/tomcat/status;
}
#location / {
# proxy_pass http://127.0.0.1:8080;
#}
}
#創建相關文件及目錄
[root@test-mysqldb ~]# mkdir -p /usr/java/tomcat/status/
[root@test-mysqldb ~]# touch /usr/java/tomcat/status/nginx-status.html
#另一台可以做相同的配置
相關說明:
1)在機器上放置文件:/usr/java/tomcat/status/nginx-status.html 。當該文件被刪除時候,/nginx-status.html這個請求會返回404,4S之后,該實例就會被從SLB中摘除。這個過程也就是“下線”的過程。
2)與之對應,touch /usr/java/tomcat/status/nginx-status.html 這個操作就是上線的過程,也是4S之后生效。
配置好SLB,訪問SLB的ip地址是可以負載均衡的
3.3、服務啟動腳本
[root@jdk-76 status]# cat appctl.sh
#!/bin/bash
PROG_NAME=$0
ACTION=$1
ONLINE_OFFLINE_WAIT_TIME=8 # 實例上下線的等待時間
APP_START_TIMEOUT=50 # 等待應用啟動的時間
APP_PORT=9001 # 應用端口
HEALTH_CHECK_URL=http://127.0.0.1:${APP_PORT} # 應用健康檢查URL
HEALTH_CHECK_FILE_DIR=/usr/java/tomcat/status # 腳本會在這個目錄下生成nginx-status.html文件
APP_HOME=/usr/java/tomcat/appboss-tomcat
#JAR_NAME=app-0.1.0.jar # jar包的名字
#APP_LOG=${APP_HOME}/logs/app.log # 應用的日志文件
PID_FILE=${APP_HOME}/tomcat.pid # 應用的pid會保存到這個文件中
# 創建出相關目錄
#mkdir -p ${HEALTH_CHECK_FILE_DIR}
#mkdir -p ${APP_HOME}
#mkdir -p ${APP_HOME}/logs
usage() {
echo "Usage: $PROG_NAME {start|stop|online|offline|restart}"
exit 2
}
online() {
# 掛回SLB
touch -m $HEALTH_CHECK_FILE_DIR/nginx-status.html || exit 1
echo "wait app online in ${ONLINE_OFFLINE_WAIT_TIME} seconds..."
sleep ${ONLINE_OFFLINE_WAIT_TIME}
}
offline() {
# 摘除SLB
rm -f $HEALTH_CHECK_FILE_DIR/nginx-status.html || exit 1
echo "wait app offline in ${ONLINE_OFFLINE_WAIT_TIME} seconds..."
sleep ${ONLINE_OFFLINE_WAIT_TIME}
}
health_check() {
exptime=0
echo "checking ${HEALTH_CHECK_URL}"
while true
do
status_code=`/usr/bin/curl -L -o /dev/null --connect-timeout 5 -s -w %{http_code} ${HEALTH_CHECK_URL}`
if [ x$status_code != x200 ];then
sleep 1
((exptime++))
echo -n -e "\rWait app to pass health check: $exptime..."
else
break
fi
if [ $exptime -gt ${APP_START_TIMEOUT} ]; then
echo
echo 'app start failed'
exit 1
fi
done
echo "check ${HEALTH_CHECK_URL} success"
}
start_application() {
echo "start tomcat"
if [ -f "$PID_FILE" ] && kill -0 "$(cat ${PID_FILE})"; then
echo "Application is running, exit"
exit 0
fi
#rm -rf ${APP_HOME}/${JAR_NAME}
#tar -zxvf /home/admin/package.tgz -C ${APP_HOME}
#java -jar ${APP_HOME}/${JAR_NAME} > ${APP_LOG} 2>&1 &
#echo $! > ${PID_FILE}
${APP_HOME}/bin/startup.sh
}
stop_application() {
echo "stop tomcat"
if [ -f "$PID_FILE" ]; then
kill -9 `cat $PID_FILE`
rm $PID_FILE
else
echo "pid file $PID_FILE does not exist, do noting"
fi
}
start() {
start_application
health_check
online
}
stop() {
offline
stop_application
}
case "$ACTION" in
start)
start
;;
stop)
stop
;;
online)
online
;;
offline)
offline
;;
restart)
stop
start
;;
*)
usage
;;
esac
參考文檔:








