Nacos(九):Nacos集群部署和遇到的問題


前言

前面的系列文章已經介紹了Nacos的如何接入SpringCloud,以及Nacos的基本使用方式

之前的文章中都是基於單機模式部署進行講解的,本文對Nacos的集群部署方式進行說明

環境准備

  • JDK8
  • Centos7.5(ip:10.1.8.27)
  • MySQL 5.6.5+
  • Nacos-server:1.0.1

請提前下載Nacos-server:1.0.1壓縮包並解壓至相應目錄

本次的Nacos-server在linux服務器上進行啟動。

集群模式部署

Nacos文檔中提供了三種集群部署方案

  1. http://ip1:port/openAPI 直連ip模式:
    • ip+端口進行部署,客戶端直接連接Nacos的ip
  2. http://Vip:port/openAPI 掛載虛擬IP模式:
    • 配合KeepAlive,Nacos真實ip都掛載虛擬Ip下
    • 客戶端訪問Vip發起請求
    • 當主Nacos宕機后,備用Nacos接管,實現高可用,
  3. http://www.nacostest.com:port/openAPI 掛載虛擬IP+域名模式:
    • 為虛擬ip綁定一個域名,當Nacos集群遷移時,客戶端配置無需修改。

這三種方案都是為了盡可能實現高可用,后兩種方案除了基本的部署流程外更多側重於實現高可用的工作上

本文以第一種ip+端口的方式為大家介紹集群部署方式

當然ip+端口也有多種部署方式

  • 1ip+n端口+Nginx:普通玩家部署方式,沒有過多服務器,單台服務器啟動多個nacos實例,僅適合測試使用
  • nip+n端口+Nginx:RMB玩家部署方式,服務器資源充足,組建完美集群,實現更好的容災與隔離

無論怎么部署,部署方式都是一樣的,這里我以1ip+3端口+Nginx的方式進行集群搭建

修改配置

1、修改Nacos-server目錄conf/下的application.properties文件,添加mysql數據源

2、修改集群配置

ip和端口的規划如下:

ip 端口
10.1.8.27 8849
10.1.8.27 8850
10.1.8.27 8851

修改conf/下的cluster.conf.example文件,將其命名為cluster.conf,內容如下

# ip:port
10.1.8.27:8849
10.1.8.27:8850
10.1.8.27:8851

注:一定要記得將配置文件重命名為cluster.conf, 最好用實際ip,而非127.0.0.1,否則會出現問題

3、修改啟動腳本

我們要在單台服務器上啟動多個Nacos實例,要保證三個實例為不同的端口,這里我們可以修改啟動腳本
定位到export FUNCTION_MODE="all"這一行,修改腳本內容,使其支持以-p傳入端口參數

export MODE="cluster"
export FUNCTION_MODE="all"
# 新加
export SERVER_PORT="8848"
while getopts ":m:f:p:" opt
do
    case $opt in
        m)
            MODE=$OPTARG;;
        f)
            FUNCTION_MODE=$OPTARG;;
        # 新加
        p)
            SERVER_PORT=$OPTARG;;
        ?)
        echo "Unknown parameter"
        exit 1;;
    esac
done
# 新加
JAVA_OPT="${JAVA_OPT} -Dserver.port=${SERVER_PORT}"

相應的,修改shutdown腳本,使其可接收參數

# 新加內容
PORT=$1
if [ ! $PORT ]; then
  echo "please select stop port!" >&2
  exit 1
fi

# 添加PORT過濾
pid=`ps ax | grep -i 'nacos.nacos' |grep java |grep ${PORT} | grep -v grep | awk '{print $1}'`

# 后邊省略...

啟動Nacos

執行如下三條命令

bash startup.sh -p 8849
bash startup.sh -p 8850
bash startup.sh -p 8851

**如果你的機器不能同時啟動3個實例,檢查是否內存不夠了,可以適當調整JVM參數 **

調整啟動腳本中JAVA_OPT="${JAVA_OPT} -server -Xms2g -Xmx2g -Xmn1g -XX:MetaspaceSize=128m -XX:MaxMetaspaceSize=320m中的-Xms -Xmx -Xmn

啟動成功后會打印如下一句話:

nacos is starting,you can check the /usr/local/nacos/nacos/logs/start.out

查看該目錄下的start.out文件,可以看到如下日志

startup

此時,多節點的集群雛形已經搭建好了,可以試着訪問Nacos后台

http://ip:8849/nacos/index.html
http://ip:8850/nacos/index.html
http://ip:8851/nacos/index.html

不出意外,可以正常訪問到Nacos控制台

從圖上可以看到集群節點共有三個,其中端口8850為leader

配置Nginx

完成上面的配置后,已經基本完成集群搭建的90%了

這里我們可以通過Nginx配置,為Nacos提供統一的入口,來實現一個簡單的負載均衡

Nginx配置如下

upstream nacos-server {
  server 127.0.0.1:8849;
  server 127.0.0.1:8850;
  server 127.0.0.1:8851;
}

server {
  listen 8848;
  server_name  localhost;
  location /nacos/ {
    proxy_pass http://nacos-server/nacos/;
  }
}

執行命令 sudo nginx啟動nginx

通過8848端口訪問Nacos后台,此時Nginx會將請求分發至nacos-server下的地址中,這里默認的分發策略是線性輪詢

客戶端測試

這里繼續使用之前的Demo項目(Nacos(四)

1、修改下項目配置文件bootstarp.yml

spring:
  application:
    name: nacos-config
  cloud:
    nacos:
      discovery:
        server-addr: 10.1.8.27:8848
      config:
        server-addr: 10.1.8.27:8848
        prefix: ${spring.application.name}
        file-extension: yml

注:主要是修改注冊中心和配置中新的地址,記得替換成你的服務器地址哦

2、啟動前確保已經向Nacos中添加配置文件,如果已經添加可以忽略

在公共空間(public)中新建一個配置文件DataID: nacos-config.yml, 配置內容如下:

server: 
    port: 9989
nacos:
    config: 配置文件已持久化到數據庫中...

3、啟動Nacos-config項目

啟動成功后檢查日志和Nacos控制台

注冊成功的日志如下:

09:37:19.366 [main] [nacos] [64] INFO o.s.c.a.n.r.NacosServiceRegistry - nacos registry, nacos-config 10.1.8.71:9989 register finished

控制台中可以看到服務已經注冊

瀏覽器請求nacos-config中的接口,查看是否可以讀取配置

訪問:http://127.0.0.1:9989/getValue 返回:配置文件和服務信息已持久化到數據庫中...

集群的部署方式就介紹完了,文中的集群部署方式不是最優的方式

實際生產環境下,至少應該保證各個Nacos節點位於不同服務器,以實現更好的隔離和容災

出現的問題

這里將我在配置集群時出現的一些問題和解決方式進行說明

1、在集群搭建完成后,啟動nacos客戶端進行服務注冊時報錯了,提示我服務端沒有啟動,稍后再試,如下:

code:503 msg: server is STARTING now, please try again later!

一臉懵B,Nacos后台都可以訪問的鴨,為啥說我沒啟動。翻閱Nacos-server的源碼后

  • 后台可訪問只能說明nacos-consloe模塊啟動成功
  • 無法注冊服務nacos-naming模塊可能啟動失敗了

參考了github中的#770-issues

必須保證`InetAddress.getLocalHost().getHostAddress()`或者`hostname -i`打印的結果是  
192.xxx.xxx.xxx而不是`127.0.0.1`才行

解決辦法如下:

  • 修改hosts,在hosts文件中添加yourip hostname,例如:10.1.8.27 lars
  • 修改cluster.conf,修改集群配置文件,全部用實際ip+端口的方式,而非127.0.0.1

總結

Nacos的集群部署基本就介紹完了,官方推薦的三種方式,他們的基本部署思路和方式都大同小異,只不過在高可用上有所不同,挑選你適合的方式動手搭建集群試試吧。

參考

Nacos支持三種部署模式

社區issues



免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM