靈雀雲：etcd 集群運維實踐

本文轉載自查看原文 2019-01-16 16:08 743 k8s kubernetes docker/ 容器技術虛擬機 docker CNCF

【編者的話】etcd 是 Kubernetes 集群的數據核心，最嚴重的情況是，當 etcd 出問題徹底無法恢復的時候，解決問題的辦法可能只有重新搭建一個環境。因此圍繞 etcd 相關的運維知識就比較重要，etcd 可以容器化部署，也可以在宿主機自行搭建，以下內容是通用的。

集群的備份和恢復

添加備份

#!/bin/bash
IP=123.123.123.123
BACKUP_DIR=/alauda/etcd_bak/
mkdir -p $BACKUP_DIR
export ETCDCTL_API=3
etcdctl --endpoints=http://$IP:2379 snapshot save $BACKUP/snap-$(date +%Y%m%d%H%M).db

# 備份一個節點的數據就可以恢復，實踐中，為了防止定時任務配置的節點異常沒有生成備份，建議多加幾個

恢復集群

#!/bin/bash

# 使用 etcdctl snapshot restore 生成各個節點的數據

# 比較關鍵的變量是
# --data-dir 需要是實際 etcd 運行時的數據目錄
# --name  --initial-advertise-peer-urls  需要用各個節點的配置
# --initial-cluster  initial-cluster-token 需要和原集群一致

ETCD_1=10.1.0.5
ETCD_2=10.1.0.6
ETCD_3=10.1.0.7

for i in ETCD_1 ETCD_2 ETCD_3
do

export ETCDCTL_API=3
etcdctl snapshot restore snapshot.db \
--data-dir=/var/lib/etcd \
--name $i \
--initial-cluster ${ETCD_1}=http://${ETCD_1}:2380,${ETCD_2}=http://${ETCD_2}:2380,${ETCD_3}=http://${ETCD_3}:2380 \
--initial-cluster-token k8s_etcd_token \
--initial-advertise-peer-urls http://$i:2380 && \
mv /var/lib/etcd/ etcd_$i

done

# 把 etcd_10.1.0.5 復制到 10.1.0.5節點，覆蓋/var/lib/etcd（同--data-dir路徑）
# 其他節點依次類推

用 etcd 自動創建的 SnapDb 恢復

 1 #!/bin/bash 
 2 export ETCDCTL_API=3
 3 etcdctl snapshot restore snapshot.db \
 4 --skip-hash-check \
 5 --data-dir=/var/lib/etcd \
 6 --name 10.1.0.5 \
 7 --initial-cluster 10.1.0.5=http://10.1.0.5:2380,10.1.0.6=http://10.1.0.6:2380,10.1.0.7=http://10.1.0.7:2380 \
 8 --initial-cluster-token k8s_etcd_token \
 9 --initial-advertise-peer-urls http://10.1.0.5:2380
10 
11 # 也是所有節點都需要生成自己的數據目錄，參考上一條
12 # 和上一條命令唯一的差別是多了  --skip-hash-check  （跳過完整性校驗）
13 # 這種方式不能確保 100% 可恢復，建議還是自己加備份
14 # 通常恢復后需要做一下數據壓縮和碎片整理，可參考相應章節

踩過的坑

[ 3.0.14 版 etcd restore 功能不可用 ] https://github.com/etcd-io/etcd/issues/7533

使用更新的 etcd 即可。

總結：恢復就是要拿 DB 去把 etcd 的數據生成一份，用同一個節點的，可以保證除了 restore 時候指定的參數外，所有數據都一樣。這就是用一份 DB，操作三次（或者5次）的原因。

集群的擴容——從 1 到 3

執行添加

1 #!/bin/bash
2 export ETCDCTL_API=2
3 etcdctl --endpoints=http://10.1.0.6:2379 member add 10.1.0.6 http://10.1.0.6:2380
4 etcdctl --endpoints=http://10.1.0.7:2379 member add 10.1.0.7 http://10.1.0.7:2380
5 
6 # ETCD_NAME="etcd_10.1.0.6" 
7 # ETCD_INITIAL_CLUSTER="10.1.0.6=http://10.1.0.6:2380,10.1.0.5=http://10.1.0.5:2380"
8 # ETCD_INITIAL_CLUSTER_STATE="existing"

准備添加的節點 etcd 參數配置

#!/bin/bash
/usr/local/bin/etcd 
--data-dir=/data.etcd 
--name 10.1.0.6
--initial-advertise-peer-urls http://10.1.0.6:2380 
--listen-peer-urls http://10.1.0.6:2380 
--advertise-client-urls http://10.1.0.6:2379 
--listen-client-urls http://10.1.0.6:2379 
--initial-cluster 10.1.0.6=http://10.1.0.6:2380,10.1.0.5=http://10.1.0.5:2380
--initial-cluster-state exsiting
--initial-cluster-token k8s_etcd_token

# --initial-cluster 集群所有節點的 name=ip:peer_url
# --initial-cluster-state exsiting 告訴 etcd 自己歸屬一個已存在的集群，不要自立門戶

踩過的坑

從 1 到 3 期間，會經過集群是兩節點的狀態，這時候可能集群的表現就像掛了，endpoint status 這些命令都不能用，所以我們需要用 member add 先把集群擴到三節點，然后再依次啟動 etcd 實例，這樣做就能確保 etcd 就是健康的。

從 3 到更多，其實還是 member add 啦，就放心搞吧。

集群加證書

生成證書

  1 curl -s -L -o /usr/bin/cfssl https://pkg.cfssl.org/R1.2/cfssl_linux-amd64
  2 curl -s -L -o /usr/bin/cfssljson https://pkg.cfssl.org/R1.2/cfssljson_linux-amd64
  3 chmod +x /usr/bin/{cfssl,cfssljson}
  4 cd /etc/kubernetes/pki/etcd
  5 
  6 
  7 #  cat ca-config.json
  8 {
  9 "signing": {
 10 "default": {
 11   "expiry": "100000h"
 12 },
 13 "profiles": {
 14   "server": {
 15     "usages": ["signing", "key encipherment", "server auth", "client auth"],
 16     "expiry": "100000h"
 17   },
 18   "client": {
 19     "usages": ["signing", "key encipherment", "server auth", "client auth"],
 20     "expiry": "100000h"
 21   }
 22 }
 23 }
 24 } 
 25 
 26 
 27 #  cat ca-csr.json
 28 {
 29 "CN": "etcd",
 30 "key": {
 31 "algo": "rsa",
 32 "size": 4096
 33 },
 34 "names": [
 35 {
 36   "C": "CN",
 37   "L": "Beijing",
 38   "O": "Alauda",
 39   "OU": "PaaS",
 40   "ST": "Beijing"
 41 }
 42 ]
 43 } 
 44 
 45 
 46 #  cat server-csr.json
 47 {
 48 "CN": "etcd-server",
 49 "hosts": [
 50 "localhost",
 51 "0.0.0.0",
 52 "127.0.0.1",
 53 "所有master 節點ip ",
 54 "所有master 節點ip ",
 55 "所有master 節點ip "
 56 ],
 57 "key": {
 58 "algo": "rsa",
 59 "size": 4096
 60 },
 61 "names": [
 62 {
 63   "C": "CN",
 64   "L": "Beijing",
 65   "O": "Alauda",
 66   "OU": "PaaS",
 67   "ST": "Beijing"
 68 }
 69 ]
 70 } 
 71 
 72 
 73 # cat client-csr.json
 74 
 75 {
 76 "CN": "etcd-client",
 77 "hosts": [
 78 ""
 79 ],
 80 "key": {
 81 "algo": "rsa",
 82 "size": 4096
 83 },
 84 "names": [
 85 {
 86   "C": "CN",
 87   "L": "Beijing",
 88   "O": "Alauda",
 89   "OU": "PaaS",
 90   "ST": "Beijing"
 91 }
 92 ]
 93 } 
 94 
 95 
 96 cd /etc/kubernetes/pki/etcd
 97 
 98 cfssl gencert -initca ca-csr.json | cfssljson -bare ca
 99 
100 cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=server server-csr.json | cfssljson -bare server
101 
102 cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=client client-csr.json | cfssljson -bare client

參考鏈接：https://lihaoquan.me/2017/3/29 ... .html

首先更新節點的peer-urls

export ETCDCTL_API=3
etcdctl --endpoints=http://x.x.x.x:2379 member list
#  1111111111  ..........
#  2222222222  ..........
#  3333333333  ..........
etcdctl --endpoints=http://172.30.0.123:2379 member update 1111111111 --peer-urls=https://x.x.x.x:2380
# 執行三次把三個節點的peer-urls都改成https

修改配置

#  vim /etc/kubernetes/main*/etcd.yaml

#  etcd啟動命令部分修改 http 為 https，啟動狀態改成 existing
- --advertise-client-urls=https://x.x.x.x:2379
- --initial-advertise-peer-urls=https://x.x.x.x:2380
- --initial-cluster=xxx=https://x.x.x.x:2380,xxx=https://x.x.x.x:2380,xxx=https://x.x.x.x:2380
- --listen-client-urls=https://x.x.x.x:2379
- --listen-peer-urls=https://x.x.x.x:2380
- --initial-cluster-state=existing

#  etcd 啟動命令部分插入
- --cert-file=/etc/kubernetes/pki/etcd/server.pem
- --key-file=/etc/kubernetes/pki/etcd/server-key.pem
- --peer-cert-file=/etc/kubernetes/pki/etcd/server.pem
- --peer-key-file=/etc/kubernetes/pki/etcd/server-key.pem
- --trusted-ca-file=/etc/kubernetes/pki/etcd/ca.pem
- --peer-trusted-ca-file=/etc/kubernetes/pki/etcd/ca.pem
- --peer-client-cert-auth=true
- --client-cert-auth=true

#  檢索hostPath在其后插入
- hostPath:
  path: /etc/kubernetes/pki/etcd
  type: DirectoryOrCreate
name: etcd-certs

#  檢索mountPath在其后插入
- mountPath: /etc/kubernetes/pki/etcd
  name: etcd-certs


#  vim /etc/kubernetes/main*/kube-apiserver.yaml
#  apiserver 啟動部分插入，修改 http 為https
- --etcd-cafile=/etc/kubernetes/pki/etcd/ca.pem
- --etcd-certfile=/etc/kubernetes/pki/etcd/client.pem
- --etcd-keyfile=/etc/kubernetes/pki/etcd/client-key.pem
- --etcd-servers=https://x.x.x.x:2379,https://x.x.x.x:2379,https://x.x.x.x:2379

總結下就是，先准備一套證書。然后修改 etcd 內部通信地址為https，這時候etcd日志會報錯(可以忽略)，然后用etcd --帶證書的參數啟動，把所有鏈接etcd的地方都用上證書，即可。

遇到的坑

[ etcd 加證書后，apiserver 的健康檢查還是 http 請求，etcd 會一直刷日志 ] https://github.com/etcd-io/etcd/issues/9285

2018-02-06 12:41:06.905234 I | embed: rejected connection from "127.0.0.1:35574" (error "EOF", ServerName "")

解決辦法：直接去掉 apiserver 的健康檢查，或者把默認的檢查命令換成 curl（apiserver 的鏡像里應該沒有 curl，如果是剛需的話自己重新 build 一下吧）

集群升級

已經是 v3 的的集群不需要太多的配置，保留數據目錄，替換鏡像（或者二進制）即可；

v2 到 v3 的升級需要一個 merge 的操作，我並沒有實際的實踐過，也不太推薦這樣做。

集群狀態檢查

其實上述所有步驟都需要這些命令的輔助——

#!/bin/bash
# 如果證書的話，去掉--cert --key --cacert 即可
# --endpoints= 需要寫了幾個節點的url，endpoint status就輸出幾條信息

export ETCDCTL_API=3

etcdctl \
--endpoints=https://x.x.x.x:2379 \ 
--cert=/etc/kubernetes/pki/etcd/client.pem \
--key=/etc/kubernetes/pki/etcd/client-key.pem \
--cacert=/etc/kubernetes/pki/etcd/ca.pem \
endpoint status -w table

etcdctl --endpoints=xxxx endpoint health

etcdctl --endpoints=xxxx member list

kubectl get cs

數據操作（刪除、壓縮、碎片整理）

刪除

ETCDCTL_API=2 etcdctl rm --recursive            # v2 的 api 可以這樣刪除一個“目錄”
ETCDCTL_API=3 etcdctl --endpoints=xxx del /xxxxx --prefix # v3 的版本

# 帶證書的話，參考上一條添加 --cert --key --cacert 即可

遇到的坑：在一個客戶環境里發現 Kubernetes 集群里的 “事件” 超級多，就是 kubectl describe xxx 看到的 events 部分信息，數據太大導致 etcd 跑的很累，我們就用這樣的方式刪掉沒用的這些數據。

碎片整理

ETCDCTL_API=3 etcdctl --endpoints=xx:xx,xx:xx,xx:xx defrag
ETCDCTL_API=3 etcdctl --endpoints=xx:xx,xx:xx,xx:xx endpoint status # 看數據量

壓縮

ETCDCTL_API=3 etcdctl --endpoints=xx:xx,xx:xx,xx:xx compact

# 這個在只有 K8s 用的 etcd 集群里作用不太大，可能具體場景我沒遇到
# 可參考這個文檔
# https://www.cnblogs.com/davygeek/p/8524477.html
# 不過跑一下不礙事

etcd --auto-compaction-retention=1

# 添加這個參數讓 etcd 運行時自己去做壓縮

常見問題

etcd 對時間很依賴，所以集群里的節點時間一定要同步
磁盤空間不足，如果磁盤是被 etcd 自己吃完了，就需要考慮壓縮和刪數據啦
加證書后所有請求就都要帶證書了，要不會提示 context deadline exceeded
做各個操作時 etcd 啟動參數里標明節點狀態的要小心，否則需要重新做一遍前面的步驟很麻煩

日志收集

etcd 的日志暫時只支持 syslog 和 stdout 兩種——https://github.com/etcd-io/etcd/issues/7936

etcd 的日志在排查故障時很有用，如果我們用宿主機來部署 etcd，日志可以通過 systemd 檢索到，但 kubeadm 方式啟動的 etcd 在容器重啟后就會丟失所有歷史。我們可以用以下的方案來做——

shell 的重定向

etcd --xxxx --xxxx   >  /var/log/etcd.log 
# 配合 logratate 來做日志切割
# 將日志通過 volume 掛載到宿主機

supervisor

supervisor 從容器剛開始流行時，就是保持服務持續運行很有效的工具。

sidecar 容器（后續我在 GitHub 上補充一個例子，github.com/jing2uo）

Sidecar 可以簡單理解為一個 Pod 里有多個容器（比如 kubedns）他們彼此可以看到對方的進程，因此我們可以用傳統的 strace 來捕捉 etcd 進程的輸出，然后在 Sidecar 這個容器里和 shell 重定向一樣操作。

strace  -e trace=write -s 200 -f -p 1

Kubeadm 1.13 部署的集群

最近我們測試 Kubernetes 1.13 集群時發現了一些有趣的改變，詐一看我們上面的命令就沒法用了——

https://kubernetes.io/docs/set ... logy/

區分了 Stacked etcd topology 和 External etcd topology，官方的鏈接了這個圖很形象——

這種模式下的 etcd 集群，最明顯的差別是容器內 etcd 的initial-cluster 啟動參數只有自己的 IP，會有點懵掛了我這該怎么去恢復。其實基本原理沒有變，Kubeadm 藏了個 ConfigMap，啟動參數被放在了這里——

kubectl get cm  etcdcfg -n kube-system -o yaml


etcd:
  local:
    serverCertSANs:
    - "192.168.8.21"
    peerCertSANs:
    - "192.168.8.21"
    extraArgs:
      initial-cluster: 192.168.8.21=https://192.168.8.21:2380,192.168.8.22=https://192.168.8.22:2380,192.168.8.20=https://192.168.8.20:2380
      initial-cluster-state: new
      name: 192.168.8.21
      listen-peer-urls: https://192.168.8.21:2380
      listen-client-urls: https://192.168.8.21:2379
      advertise-client-urls: https://192.168.8.21:2379
      initial-advertise-peer-urls: https://192.168.8.21:2380

Q&A

Q：請問 etcd 監控和告警如何做的？告警項都有哪些？

A：告警要看用的什么監控吧，和 Kubernetes 配套比較常見的是普羅米修思和 Grafana 了。告警項我沒有具體配過，可以關注的點是：endpoint status -w table 里可以看到數據量，endpoints health 看到健康狀態，還有內存使用這些，具體可以參考普羅米修思的 exporter 是怎么做的。

Q：使用 Kubeadm 部署高可用集群是不是相當於先部署三個獨立的單點 Master，最后靠 etcd 添加節點操作把數據打通？

A：不是，Kubeadm 部署會在最開始就先建一個 etcd 集群，apiserver 啟動之前就需要准備好 etcd，否則 apiserver 起不了，集群之間就沒法通信。可以嘗試手動搭一下集群，不用 Kubeadm，一個個把組件開起來，之后對Kubernetes的組件關系會理解更好的。

Q：etcd 跨機房高可用如何保證呢？管理 etcd 有好的 UI 工具推薦么？

A：etcd 對時間和網絡要求很高，所以跨機房的網絡不好的話性能很差，光在那邊選請輸入鏈接描述舉去了。我分享忘了提一個 etcd 的 mirror，可以去參考下做法。跨機房的話，我覺得高速網絡是個前提吧，不過還沒做過。UI 工具沒找過，都是命令行操作來着。

Q：Kubeadm 啟動的集群內 etcd節點，kubectl 操作 etcd 的備份恢復有嘗試過嗎？

A：沒有用 kubectl 去處理過 etcd 的備份恢復。etcd 的恢復依賴用 SnapDb 生成數據目錄，把 etcd 進程丟進容器里，類似的操作避免不了，還有啟動的狀態需要修改。kubeadm 啟動的 etcd 可以通過 kubectl 查詢和 exec，但是數據操作應該不可以，比如恢復 etcd ing 時，無法連接 etcd，kubectl 還怎么工作？

Q：kubeadm-ha 啟動 3 個 Master，有 3 個 etcd 節點，怎么跟集群外的 3 個 etcd 做集群，做成 3 Master 6 etcd？

A：可以參考文檔里的擴容部分，只要保證 etcd 的參數正確，即使一個集群一部分容器化，一部分宿主機，都是可以的（當然不建議這么做）。可以先用 kubeadm 搭一個集群，然后用擴容的方式把其他三個節點加進來，或者在 kubeadm 操作之前，先搭一個 etcd 集群。然后 kubeadm 調用它就可以。

Q：有沒有試過 Kubeadm 的滾動升級，etcd 版本變更，各 Master 機分別重啟，數據同步是否有異常等等？

A：做過。Kubeadm 的滾動升級公司內部有從 1.7 一步步升級到 1.11、1.12 的文檔，或多或少有一點小坑，不過今天主題是 etcd 所以沒提這部分。各個 Master 分別重啟后數據的一致我們測試時沒問題，還有比較極端的是直接把三 Master 停機一天，再啟動后也能恢復。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 什么是Etcd，如何運維Etcd ？關於Prometheus運維實踐項目 PB級大規模Elasticsearch集群運維與調優實踐電商行業運維實踐 1、自動化運維之SaltStack實踐【kafka學習之三】kafka集群運維 ElasticSearch 集群的規划部署與運維【mongoDB運維篇④】Shard 分片集群 hadoop集群運維碰到的問題匯總《阿里雲運維架構秘籍》筆記