環境准備: 三台 master 宕掉兩台或三台 在宕掉兩台或三台 master 后集群已宕掉,worker 節點中的 pod 可以正常運行,這里考慮機器可以正常修復,並能正常啟動。 這里模擬測試: 停掉 192.168.244.12,192.168.244.13 兩台 ...
我們的生產環境 kubernetes 集群是用阿里雲服務器自己搭建的高可用集群 詳見之前的博文 ,這篇博文記錄的是如何通過已有集群的 台 master 服務器的阿里雲ECS鏡像恢復出同樣配置的新集群,kubernetes 版本是 . . 。 這台 master 服務器的主機名是 k s master ,IP地址是 . . . 。 首先對 k s master 服務器打快照並生成鏡像,用這個鏡像創建 ...
2021-01-13 21:24 1 354 推薦指數:
環境准備: 三台 master 宕掉兩台或三台 在宕掉兩台或三台 master 后集群已宕掉,worker 節點中的 pod 可以正常運行,這里考慮機器可以正常修復,並能正常啟動。 這里模擬測試: 停掉 192.168.244.12,192.168.244.13 兩台 ...
最近剛看完推薦書單中的一本書:《質量全面管控:從項目管理到容災測試》,其中最后一章講述的是災難恢復和容災測試相關的一些內容。 這篇博客,整理了有關災難恢復的一些知識點,以及從其他資料中整理的一些內容,僅供參考。。。 關於災難恢復 1、定義:災難發生后,將生產平台恢復到正常運行的能力 ...
以阿里雲ACK集群為例進行說明: 備份 通過ack-etcd-backup-operator進行備份,這里對備份不做過多說明。 模擬故障 1停止ETCD服務 在3台master幾點即etcd服務所在節點,將etcd服務關停 2 破壞數據 因為是模擬故障,所以先備份,然后在銷毀數據 ...
背景 1 台 master 加入集群后發現忘了修改主機名,而在 k8s 集群中修改節點主機名非常麻煩,不如將 master 退出集群改名並重新加入集群(前提是用的是高可用集群)。 操作步驟 ssh 登錄另外一台 master 節點將要改名的 master 節點移出集群。 登錄已退出集群 ...
注意:本教程適合bitbucket的災難恢復或者服務遷移 前提條件已經使用bitbucket backup client 做了備份 環境說明 * centos 7* SQL Server 2012* Java 1.8* Bitbucket old edition ...
災難恢復 etcd 被設計為能承受機器失敗。etcd 集群自動從臨時失敗(例如,機器重啟)中恢復,而且對於一個有 N 個成員的集群能容許 (N-1)/2 的持續失敗。當一個成員持續失敗時,不管是因為硬件失敗或者磁盤損壞,它丟失到集群的訪問。如果集群持續丟失超過 (N-1)/2 的成員 ...
參考鏈接: K8S集群多master:Etcd v3備份與恢復 K8S集群單master:Kubernetes Etcd 數據備份與恢復 ETCD系列之一:簡介:https://developer.aliyun.com/article/11035 ...
一、Etcd簡介 Etcd是Kubernetes集群中的一個十分重要的組件,用於保存集群所有的網絡配置和對象的狀態信息。 整個kubernetes系統中一共有兩個服務需要用到etcd用來協同和存儲配置,分別是: 網絡插件flannel、對於其它網絡插件也需要用到etcd存儲網絡的配置 ...