1,安裝環境准備
1.1 獲取安裝包
- 藍鯨社區版包含部署腳本、產品軟件和開源組件。藍鯨提供完整包與分包的下載通道,請自行到下載地址按需獲取。新裝環境及新用戶建議下載完整包使用。
- 下載地址: https://bk.tencent.com/download/
- 下載完成后,請核對MD5碼。
1.2 節點資源准備
- 官方給出比較合理的初始配置,基於以下考慮:
- 1,分布式模塊達到高可用至少三個節點,所以至少需要三個OS(物理機或虛擬機均可)
- 2,Bkdata是耗費資源最多的藍鯨組件。請分配到4核16G以上的機器。
- 3,若日志檢索,藍鯨監控是主要使用場景,請給influxdb和elasticsearch模塊更多的內存,更好磁盤性能比如SSD。
- 4,nginx模塊所在的機器需要有對外提供服務,可訪問的IP。這是藍鯨平台的總入口。
- 5,如果需要有跨雲管理需求,gse部署的機器需要有跨雲的網絡條件。
主機名 | IP地址 | 組件 |
---|---|---|
bknode1.bk.com | 10.0.0.1 | nginx,rabbitmq,kafka(config),zk(config),es,appt,fta,consul,bkdata(databus) |
bknode2.bk.com | 10.0.0.2 | mongodb,appo,kafka(config),zk(config),es,mysql,consul,bkdata(dataapi),beanstalk |
bknode3.bk.com | 10.0.0.3 | paas,cmdb,job,gse,license,kafka(config),zk(config),es,redis,influxdb,consul,bkdata(monitor) |
2,CentOS系統設置
- 系統版本:要求CentOS-7.0以上版本,推薦CentOS-7.5
2.1 關閉SELinux
- 檢查SELinux的狀態,如果它已經禁用,可以跳過后面的命令
sestatus
- 可以使用以下命令禁用SELinux,或者修改配置文件:
# 通過命令臨時禁用SELinux
setenforce 0
# 通過命令永久禁用SELinux
sed -i '/^SELINUX=/ s/enforcing/disabled/' /etc/selinux/config
- 接着,重啟機器:
reboot
2.2 安裝rsync命令
- 安裝腳本依賴rsync分發同步文件。
# 檢查是否有rsync命令,如果有返回rsync路徑,可以跳過后面的命令
which rsync
# 安裝rsync
yum -y install rsync
2.3 關閉防火牆(firewalld) 和 NetworkManager
- firewalld
systemctl stop firewalld
systemctl disable firewalld &>/dev/null
- NetworkManager
systemctl stop NetworkManager.service
systemctl disable NetworkManager.service &>/dev/null
2.4 調整最大文件打開數
- 檢查當前root賬號下的max open files值
ulimit -n
- 修改limit配置文件
cat >> /etc/security/limits.conf <<EOF
* soft nproc 65530
* hard nproc 65530
* soft nofile 65530
* hard nofile 65530
EOF
- 命令行設置臨時生效
# -n 每個進程可以同時打開的最大文件數
ulimit -n 65535
# -u 可以運行的最大並發進程數
ulimit -u 20480
2.5 確認服務器時間同步
- 服務器后台時間不同步會對時間敏感的服務帶來不可預見的后果。務必在安裝和使用藍鯨時保證時間同步。
- 檢查每台機器當前時間和時區是否一致,若相互之間差別大於3s(考慮批量執行時的時差),建議校時。
date -R
- 查看和ntp server的時間差異(需要外網訪問,如果內網有ntpd服務器,自行替換域名為該服務的地址)
ntpdate -d cn.pool.ntp.org
- 如果輸出的最后一行offset大於1s建議校時,和ntp服務器同步時間
ntpdate cn.pool.ntp.org
2.6 檢查是否存在全局HTTP代理
- 藍鯨服務器之間會有的http請求,如果存在http代理,且未能正確代理這些請求,會發生不可預見的錯誤。
- 檢查http_proxy https_proxy變量是否設置,若為空可以跳過后面的操作
echo "$http_proxy" "$https_proxy"
- 對於本機配置http_proxy變量的方式,請依次查找文件/etc/profile、/etc/bashrc、$HOME/.bashrc等是否有設置。 或者咨詢網絡管理員/IT部門協助處理。
3,安裝部署
- 選擇任意一台機器作為藍鯨的運維中控機,例如:bknode1.bk.com
3.1 解壓部署安裝包
- 將下載的藍鯨社區版完整包上傳到中控機,並解壓到 同級 目錄下。以解壓到/data 目錄為例:
tar zxf bkce_src-5.0.3.tar.gz -C /data
- 解壓之后, 得到兩個目錄: src, install
- src: 存放藍鯨產品軟件, 以及依賴的開源組件
- install: 存放安裝部署腳本、安裝時的參數配置、日常運維腳本等
3.2 配置 YUM 源 和 PIP 包
3.2.1 在線 YUM 源 和 PIP 包
3.2.1.1 騰訊雲CentOS
- 備份系統舊配置文件
mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup
- 獲取對應版本的CentOS-Base.repo 到/etc/yum.repos.d/目錄
# centos7
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.cloud.tencent.com/repo/centos7_base.repo
- 更新緩存
yum clean all
yum makecache
3.2.1.2 騰訊雲EPEL
- EPEL (Extra Packages for Enterprise Linux) 是由 Fedora Special Interest Group 為企業 Linux 創建、維護和管理的一個高質量附加包集合適用於但不僅限於 Red Hat Enterprise Linux (RHEL), CentOS, Scientific Linux (SL), Oracle Linux (OL)
- 備份系統舊配置文件
mv /etc/yum.repos.d/epel.repo /etc/yum.repos.d/epel.repo.backup
- 獲取對應版本的epel配置文件到/etc/yum.repos.d/目錄
# epel(RHEL7系列)
wget -O /etc/yum.repos.d/epel.repo http://mirrors.cloud.tencent.com/repo/epel-7.repo
- 更新緩存
yum clean all
yum makecache
3.2.1.3 PIP 源
- (4.0版本需要准備,沒有這個目錄和文件,需要創建) # 5.0不需要
# 騰訊雲 PIP 源
$ cat /data/src/.pip/pip.conf
[global]
index-url = http://mirrors.cloud.tencent.com/pypi/simple
trusted-host = mirrors.cloud.tencent.com
# 阿里雲 PIP 源
$ /data/src/.pip/pip.conf
[global]
index-url = http://mirrors.aliyun.com/pypi/simple
trusted-host = mirrors.aliyun.com
3.2.2 離線 YUM 源 和 PIP 包
- 方法一:在有公網的情況下搭建一套完整的藍鯨平台,下載打包所需的依賴rpm包
- 方法二:在有公網的情況下,下載解壓官方安裝包,在腳本
install/dependences.env
文件中查看所有角色所依賴的組件,下載打包所需的依賴rpm包
3.2.2.1 離線 YUM 源,方法一
- 配置yum安裝保留rpm包
# grep 'keepcache' /etc/yum.conf
keepcache=1
- 打包下載的rpm包
find /var/cache/ -type f -name "*.rpm" | xargs -i cp {} /opt/bk_repo/
cd /opt
tar zcvf bk_rpm.tar.gz bk_repo
3.2.2.2 離線 YUM 源,方法二
- 下載官方安裝包
- 藍鯨平台所依賴的組件都已經包含在安裝腳本的
install/dependences.env
文件中,查看所有角色所依賴的組件。
$ cat dependences.env
# 依賴包設置, 需要通過yum 安裝的依賴包放在這里.
source ./utils.fc
load_functions dependences third
load_functions dependences extra
commands=(zip unzip pidof pkill rsync gawk curl lsof tar sed iproute uuid psmisc wget)
required=(openssl-devel readline-devel libcurl-devel libxml2-devel glibc-devel zlib-devel iproute sysvinit-tools procps-ng bind-utils)
open_paas_required=(gcc mysql mysql-devel libevent-devel bzip2-devel sqlite-devel tk-devel gdbm-devel db4-devel libpcap-devel xz-devel pcre-devel svn nfs-utils)
paas_agent_required=(mysql-devel gcc libevent-devel git svn nfs-utils)
cmdb_required=(nginx)
fta_required=(mysql-devel gcc libevent-devel patch)
mysql_required=(libaio-devel)
consul_required=()
gse_required=()
fta_required=(mysql-devel gcc libevent-devel patch)
job_required=(libcurl nfs-utils)
bkdata_required=(openssl-devel ncurses-devel mysql-devel python-devel gcc gcc-c++ make cmake bison-devel ncurses-devel pcre-devel readline-devel snappy-devel patch snappy snappy-devel)
rabbitmq_required=(gcc make cmake gcc-c++ socat)
zabbix_required=(zabbix-server zabbix-agent php)
bkdata_dependson=(license cmdb paas redis kafka zk es beanstalk consul)
cmdb_dependson=(nginx license mongodb redis consul)
job_dependson=(nginx redis mysql license rabbitmq paas gse cmdb consul)
paas_dependson=(nginx redis mysql license consul)
appo_dependson=(paas nginx license rabbitmq)
- 對該文件的其它內容進行注釋,l留下定義變量的內容
$ cat dependences.env
# 依賴包設置, 需要通過yum 安裝的依賴包放在這里.
#source ./utils.fc
#load_functions dependences third
#load_functions dependences extra
- 然后加載該文件,讓所有的變量加載到系統中
$ source dependences.env
$ echo ${commands[@]}
zip unzip pidof pkill rsync gawk curl lsof tar sed iproute uuid psmisc wget
- 使用yum進行下載,但不安裝。
yum install ${commands[@]} --downloadonly --downloaddir=/opt/bk_repo/
- 打包下載的rpm包
cd /opt
tar zcvf bk_rpm.tar.gz bk_repo
3.2.2.3 配置本地 YUM REPO 源
- 創建repo索引
createrepo bk_repo
- 編寫yum源配置文件
cat > /etc/yum.repos.d/bk_repo.repo << EOF
[bk_repo]
name=bk_repo
baseurl=file:///mnt/repo/
gpgcheck=0
enabled=1
EOF
- 更新緩存
yum clean all
yum makecache
3.2.2.4 在安裝部署時,依賴包沖突報錯,根據報錯情況下載對應的依賴包
# 查找報錯rpm包
rpm -qa | grep pkg_name.rpm
# 卸載報錯對應rpm包
rpm -e pkg_name.rpm
# 安裝報錯對應rpm包
rpm -Uvh pkg_name.rpm
# 強制執行參數
--nodeps
3.2.2.5 獲取該版本下的 PIP 包
-
PIP包藍鯨自帶了離線包,所以無需單獨下載。 不過bkdata和fta自帶的包可能會和安裝時的操作系統不匹配,導致安裝失敗
-
在有網絡環境下,可以用以下方式下載pip包:
pip install --download /pip -r requirements.txt # 舊版 pip 下載方式
pip download -d /pip -r requirements.txt # pip 9, 10 版本的下載方式
- 獲取 pip 安裝包 requirements.txt 路徑,以及下載離線包后應該存放的路徑。
$ find /data/src/ -type f -name "requirements.txt"
# bkdata 所需的 pip 包
/data/src/bkdata/monitor/requirements.txt
/data/src/bkdata/dataapi/metaapi/requirements.txt
/data/src/bkdata/dataapi/requirements.txt
/data/src/bkdata/dataapi/ja/requirements.txt
# 需要放到以下路徑
/data/src/bkdata/support-files/pkgs
# paas_agent下的 pip 包其實時給SaaS部署用的。
/data/src/paas_agent/support-files/pkgs/requirements.txt
/data/src/paas_agent/paas_agent/etc/build/packages/requirements.txt
/data/src/paas_agent/paas_agent/requirements.txt
# 需要放到以下路徑
/data/src/paas_agent/support-files/pkgs
# open_paas 角色所需的 pip 包
/data/src/open_paas/support-files/pkgs/requirements.txt
/data/src/open_paas/paas/requirements.txt
/data/src/open_paas/login/requirements.txt
/data/src/open_paas/esb/requirements.txt
/data/src/open_paas/appengine/requirements.txt
# 需要放到以下路徑
/data/src/open_paas/support-files/pkgs
# fta 角色所需的 pip 包
/data/src/fta/fta/project/conf/requirements.txt
/data/src/fta/fta/requirements.txt
# 需要放到以下路徑
/data/src/fta/support-files/pkgs
3.3 配置文件
- 在 install 目錄下, 共有三個配置
install.config
globals.env
ports.env
3.3.1 install.config
- install.config 是模塊和服務器對應關系的配置文件,描述在哪些機器上安裝哪些模塊。 每行兩列,第一列是IP地址;第二列是以英文逗號分隔的模塊名稱。 詳情參考install.config.3IP.sample文件(可將install.config.3IP.sample 復制為install.config)。
[bkce-basic]
10.0.0.1 nginx,rabbitmq,kafka(config),zk(config),es,appt,fta,consul,bkdata(databus)
10.0.0.2 mongodb,appo,kafka(config),zk(config),es,mysql,consul,bkdata(dataapi),beanstalk
10.0.0.3 paas,cmdb,job,gse,license,kafka(config),zk(config),es,redis,influxdb,consul,bkdata(monitor)
- 說明:
- 該配置文件,ip 后面使用空格與服務名稱隔開,含有多個內網 ip 的機器,默認使用 /sbin/ifconfig 輸出中的第一個內網ip, 在 ip 后面寫上該機器要安裝的服務列表即可, 部署過程中默認使用標准私有地址, 若企業環境使用非標准私有地址, 請參考非標准內網ip處理的處理方法。
- zk 表示 zookeeper, es 表示 elasticsearch
- gse 與 redis 需要部署在同一台機器上
- gse 若需要跨雲支持, gse 所在機器必須有外網 IP
- 增加機器數量時, 可以將以上配置中的服務挪到新的機器上,分擔負載。 要保證: kafka, es, zk 的每個組件的總數量為3
3.3.1.1 非標准私有地址處理方法
- 藍鯨社區版部署腳本中(install目錄和src目錄)下有以下文件中有獲取 ip 的函數 get_lan_ip, 非標准地址, 均需要在安裝部署前完成修改。
src/job/support-files/sql/0003_job_ce_20180712-1002_mysql.sql
src/gse/plugins_windows_x86/bin/stop.sh
src/gse/plugins_windows_x86/bin/start.sh
src/gse/plugins_windows_x86/bin/reload.sh
src/gse/plugins_linux_x86_64/bin/stop.sh
src/gse/plugins_linux_x86_64/bin/start.sh
src/gse/plugins_linux_x86_64/bin/reload.sh
src/gse/agent_linux_x86_64/bin/gsectl
src/gse/plugins_windows_x86_64/bin/stop.sh
src/gse/plugins_windows_x86_64/bin/start.sh
src/gse/plugins_windows_x86_64/bin/reload.sh
src/gse/plugins_linux_x86/bin/stop.sh
src/gse/plugins_linux_x86/bin/start.sh
src/gse/plugins_linux_x86/bin/reload.sh
src/gse/server/bin/gsectl
src/gse/agent_linux_x86/bin/gsectl
src/gse/proxy/bin/gsectl
install/appmgr/docker/saas/buildsaas
install/appmgr/docker/build
install/agent_setup/download#agent_setup.sh
install/agent_setup/download#agent_setup_pro.sh
install/agent_setup/download#agent_setup_aix.ksh
install/scripts/gse/plugins/stop.sh
install/scripts/gse/plugins/start.sh
install/scripts/gse/plugins/reload.sh
install/scripts/gse/server/gsectl
install/scripts/gse/agent/gsectl
install/scripts/gse/proxy/gsectl
install/scripts/gse/agentaix/gsectl.ksh
install/precheck.sh
install/functions
- 這些文件列表,可能隨版本迭代變動,也可以用以下命令查找出來包含這個函數的腳本文件有哪些:
grep -l 'get_lan_ip *()' -r /data/install
- 修改方法:
- 假設服務器的ip是:138.x.x.x,它不在標准的私有地址范圍,那么你需要修改get_lan_ip ()函數:
- 假設服務器有多個網卡,需要過濾出正確的網卡,例如:eth1
# ip addr 獲取IP地址
get_lan_ip () {
#
ip addr | grep -A5 -E ' eth1:' | \
awk -F'[ /]+' '/inet/{
split($3, N, ".")
if ($3 ~ /^192.168/) {
print $3
}
if (($3 ~ /^172/) && (N[2] >= 16) && (N[2] <= 31)) {
print $3
}
if ($3 ~ /^10\./) {
print $3
}
}'
return $?
}
# ifconfig -a 獲取IP地址
get_lan_ip () {
#
ifconfig -a | grep -A5 -E '^eth1:' | \
awk -F'[ /\t]+' '/inet/{
split($3, N, ".")
if ($3 ~ /^192.168/) {
print $3
}
if (($3 ~ /^172/) && (N[2] >= 16) && (N[2] <= 31)) {
print $3
}
if ($3 ~ /^10\./) {
print $3
}
}'
return $?
}
3.3.2 globals.env
-
該文件定義了各類組件的賬號密碼信息. 功能開關控制選項等. 可根據實際情況進行修改.
-
配置項含義, 請查看文件中的注釋
- 該文件含密碼信息,請保證除了root用戶外,其他用戶不可讀。
- 各類賬號密碼建議修改, 注意設置的各類密碼不能有 / $ ` < > &等特殊字符
- 配置HTTP代理: 若公司不能訪問外網, 但有自己的 proxy, 在該配置文件的 BK_PROXY 選項中指定代理地址.
- 若需要跨雲管理功能(服務器在不同的 IDC, 內網不互通的情況):
- 需要將 gse 所在機器的外網IP填到該文件中 GSE_WAN_IP 配置項中的括號里 如: export GSE_WAN_IP=(1.2.3.4), 若沒有外網IP 則留空
- HAS_DNS_SERVER 配置默認為0,表示配置的藍鯨域名需要通過/etc/hosts來解析,此時部署腳本會自動修改每台機器的/etc/hosts添加相關域名。如果想走自己的dns配置,改為非0即可。
- HTTP_SCHEMA=http 默認HTTP_SCHEMA設置為http即藍鯨軟件全站為http,若設置為https則藍鯨軟件全站為https,可支持http和https的切換。
-
該配置文件中提供了訪問藍鯨三大平台的域名配置, 需要提前准備好.
export BK_DOMAIN="bk.com" # 藍鯨根域名(不含主機名)
export PAAS_FQDN="paas.$BK_DOMAIN" # PAAS 完整域名
export CMDB_FQDN="cmdb.$BK_DOMAIN" # CMDB 完整域名
export JOB_FQDN="job.$BK_DOMAIN" # JOB 完整域名
- 說明:
- BK_DOMAIN的值不能為"com" "net" 這種頂級域名, 至少二級域名開始。
- FQDN的選擇需要遵循DNS的命名規范,可選的字符集是[A-Za-z0-9.]以及"-", 特別要注意,下划線(_)是不允許的。
- PAAS_FQDN CMDB_FQDN JOB_FQDN的值都必須在BK_DOMAIN定義的根域名之下,保證登陸鑒權的cookie文件有效。
3.3.3 ports.env
- 端口定義。 默認情況下, 不用修改。特殊場景下,若有端口沖突,可以自行定義。
3.4 獲取證書
- 通過ifconfig或者ip addr命令獲取install.config文件中,license和gse模塊所在服務器的第一個內網網卡的MAC地址。如果分別屬於兩台服務器,那么兩個的MAC地址以英文;分隔。
# 網卡名為:eth1
cat /sys/class/net/eth1/address
- 在官網證書生成頁面
https://bk.tencent.com/download_ssl/
根據輸入框提示填入MAC地址,生成並下載證書。 - 上傳證書到中控機,並解壓到 src/cert 目錄下
tar xf ssl_certificates.tar.gz -C /data/src/cert/
3.5 配置 SSH 免密登陸
登錄到中控機,執行以下操作
cd /data/install
bash configure_ssh_without_pass # 根據提示輸入各主機的 root 密碼完成免密登陸配置
3.6 安裝前校驗環境是否滿足
- 按文檔要求做完環境和部署的配置后,准備開始安裝前,請運行以下腳本,來校驗是否滿足:
cd /data/install
bash precheck.sh
- 正常輸出如下圖所示:
start <<check_ssh_nopass>> ... [OK]
start <<check_password>> ... [OK]
start <<check_cert_mac>> ... [OK]
start <<check_get_lan_ip>> ... [OK]
start <<check_install_config>> ... [OK]
start <<check_selinux>> ... [OK]
start <<check_umask>> ... [OK]
start <<check_rabbitmq_version>> ... [OK]
start <<check_http_proxy>> ... [OK]
start <<check_open_files_limit>> ... [OK]
start <<check_domain>> ... [OK]
start <<check_rsync>> ... [OK]
start <<check_service_dir>> ... [OK]
start <<check_networkmanager>> ... [OK]
start <<check_firewalld>> ... [OK]
- 如果發現有[FAIL]的報錯,按照提示和本文檔修復。修復后,可繼續跑precheck.sh腳本,直到不再出現[FAIL]。如果需要從頭開始檢查,請使用 precheck.sh -r 參數。
3.7 安裝部署組件
- 在部署期間會自動解析添加到 /etc/hosts 和 /etc/resolv.conf,如果沒有請自行添加
# cat /etc/hosts
10.0.0.1 bknode1.bk.com
10.0.0.1 paas.bk.com
10.0.0.1 cmdb.bk.com
10.0.0.1 job.bk.com
# cat /etc/resolv.conf
nameserver 127.0.0.1
- 按順序執行,如果有報錯,先解決報錯再繼續執行下一步
cd /data/install
# 該步驟后,可以打開 paas 平台
./bk_install paas # 安裝paas 平台及其依賴服務
# 該步驟完成后, 可以打開 cmdb, 看到藍鯨業務及示例業務
./bk_install cmdb # 安裝 cmdb 及其依賴服務
# 該步驟完成后, 可以打開作業平台, 並執行作業
# 同時在配置平台中可以看到藍鯨的模塊下加入了主機
./bk_install job # 安裝作業平台及其依賴組件,並在安裝藍鯨的服務器上裝好 gse_agent 供驗證
# 該步驟完成后可以在開發者中心的 服務器信息 和 第三方服務信息 中看到已經成功激活的服務器
# 同時也可以進行 saas 應用(除藍鯨監控和日志檢索)的上傳部署
./bk_install app_mgr # 部署正式環境及測試環境
# 1. 通過./bk_install saas-o bk_nodeman 部署節點管理app, 或
# 2. 通過開發者中心部署app.
./bk_install saas-o bk_nodeman
# 安裝該模塊后,可以開始安 saas 應用: 藍鯨監控及日志檢索
./bk_install bkdata # 安裝藍鯨數據平台基礎模塊及其依賴服務
# 1. 通過./bk_install saas-o bk_monitor 部署 藍鯨監控app, 或
# 2. 通過開發者中心部署 藍鯨監控app
./bk_install saas-o bk_monitor
# 安裝 fta 后台
./bk_install fta # 安裝故障自愈的后台服務
# 1. 通過./bk_install saas-o bk_fta 部署故障自愈app, 或
# 2. 通過開發者中心部署故障自愈app
saas_o bk_fta
# 1. 通過./bk_install saas-o bk_fta_solutions 部署故障自愈app, 或
# 2. 通過開發者中心部署故障自愈app
./bk_install saas-o bk_fta_solutions
# 重裝一下 gse_agent 並注冊正確的集群模塊到配置平台
./bkcec install gse_agent
# 部署官方SaaS到正式環境(通過命令行從/data/src/official_saas/目錄自動部署SaaS)
./bkcec install saas-o
4,配置windows hosts 解析
# Windows10:
$ C:\Windows\System32\drivers\etc\hosts 文件末尾加上
10.0.0.1 paas.bk.com cmdb.bk.com job.bk.com
5,報錯錦集
- 安裝saas-o報錯 No module named MySQLdb
# 在中控機 install 目錄執行 /opt/py27/bin/pip install argparse requests mysql-python --no-index --find-links=./pip
# 再進行安裝 ./bkcec install saas-o
- 安裝 APPO 報錯 activate appo failed. api:/v1/agent/init/?agent_ip=xxx, response: {"msg": "active 10.xxx.xx.xx fail, the paas_agent return: None"}
# 查看日志是否提示證書驗證失敗 /data/bkce/logs/paas_agent/agent.log
# APPO機器執行 dig license.service.consul 解析失敗,
# 在 /etc/resolv.conf 第一行添加 nameserver 127.0.0.1
# 重啟APPO后重新安裝恢復
- 啟動cmdb_adminserver報錯 cmdb_adminserver FATAL Exited too quickly (process log may have details)
# cmdb_adminserver 啟動有異常基本就能判定是cmdb鏈接zk有問題。
# dig zk.service.consul
# "IN A" 后面沒有 ip地址,說明consul 啟動了,但是無法解析域名
# 在 /etc/resolv.conf 第一行添加 nameserver 127.0.0.1
# 重啟服務
echo consul cmdb zk | xargs -n 1 ./bkcec stop
echo consul cmdb zk | xargs -n 1 ./bkcec start
- bkdata 報錯 create topic failed. migrate failed for bkdata(dataapi)
## 注冊kafka topic 失敗,重啟 kafka 即可
echo kafka | xargs -n 1 ./bkcec stop
echo kafka l cmdb zk | xargs -n 1 ./bkcec start
# 重啟服務
echo bkdata | xargs -n 1 ./bkcec stop
echo bkdata | xargs -n 1 ./bkcec start
- 節點管理界面,安裝卸載節點沒有日志輸出

1,在開發者中心-->s-mart應用-->找到需要重裝的saas-->點擊部署,如果不生效,執行下一步
2,在rabbitmq機器執行 rabbitmqctl delete_vhost prod_bk_nodeman 刪除vhosts后
3,重新部署節點管理saas
4,如果不生效,先下架節點管理saas,執行 rabbitmqctrl 刪除vhosts,再重新部署節點管理saas
- influxd 在部署完成后報接口調用404,暫未解決
Oct 20 15:47:11 bknode3 influxd: [httpd] 10.0.0.1 - - [20/Oct/2019:15:47:11 +0800] "POST /write?db=system_2 HTTP/1.1" 404 45 "-" "Java/1.8.0_171" d34e6c2f-f30d-11e9-83ca-000000000000 94