Kubernetes&Docker集群部署

本文轉載自查看原文 2022-01-19 09:56 1984 容器/雲原生

集群環境搭建

搭建kubernetes的集群環境

環境規划

集群類型

kubernetes集群大體上分為兩類：一主多從和多主多從。

一主多從：一台Master節點和多台Node節點，搭建簡單，但是有單機故障風險，適合用於測試環境
多主多從：多台Master節點和多台Node節點，搭建麻煩，安全性高，適合用於生產環境

安裝方式

kubernetes有多種部署方式，目前主流的方式有kubeadm、minikube、二進制包

minikube：一個用於快速搭建單節點kubernetes的工具
kubeadm：一個用於快速搭建kubernetes集群的工具
二進制包：從官網下載每個組件的二進制包，依次去安裝，此方式對於理解kubernetes組件更加有效

主機規划

這里推薦使用Centos7.6.1810的系統，其它系統可能會出現意想不到的問題。如使用Centos7.3的系統會出現 網絡同步Chronyd 啟動不成功問題，Centos7.x可以通過yum update來升級內核。

作用	IP地址	操作系統	配置
k8s-Master	10.80.6.120	Centos7.6.1810	8H/8G 50G
k8s-Node1	10.80.6.121	Centos7.6.1810	8H/8G 50G
k8s-Node2	10.80.6.122	Centos7.6.1810	8H/8G 50G

環境搭建

本次環境搭建需要安裝四台Centos服務器（一主三從），然后在每台服務器中分別安裝docker（19.03.5），kubeadm（1.18.8）、kubelet（1.18.8）、kubectl（1.18.8）程序。

可能通過kubectl查看版本時會變成1.18.20 並不影響使用。1.18.20一樣也適配docker（19.03.5）

如果需要別的版本可以自行查詢K8s和Docker版本的適配。

主機安裝

安裝虛擬機過程中注意下面選項的設置：

操作系統環境：CPU（2H）內存（8G）硬盤（30G）
語言選擇：中文簡體
軟件選擇：基礎設施服務器
分區選擇：自動分區
網絡配置：按照下面配置網路地址信息

# 要查看自己本機的 IP地址(IPADDR)、掩碼地址(NETMASK)、網關(GATEWAY)、DNS地址 然后填上去
$ vi /etc/sysconfig/network-scripts/ifcfg-ensxxx
BOOTPROTO=static
ONBOOT=yes
IPADDR=10.80.6.120
NETWASK=255.255.0.0
GATEWAY=10.80.6.1
DNS1=114.114.114.114
DNS2=10.80.6.1
DNS3=8.8.8.8

主機名設置：按照下面信息設置主機名

master$ hostnamectl set-hostname k8s-master #master節點: k8s-master
node1$ hostnamectl set-hostname k8s-node1 #node1節點: k8s-node1
node2$ hostnamectl set-hostname k8s-node2 #node2節點: k8s-node2

環境初始化

更換鏡像源

#創建sh腳本,將以下內容粘貼到reposintall.sh里
$ vi reposinstall.sh
#!/bin/bash
cd /etc/yum.repos.d/
mkdir repo_bak
mv *.repo repo_bak/
curl -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repo
yum clean all
yum makecache
yum install -y epel-release.noarch
yum clean all
yum makecache
yum repolist all

$ sh reposinstall.sh
.......

檢查操作系統的版本

# 此方式下安裝kubernetes集群要求Centos版本要在7.5或之上
$ cat /etc/redhat-release
CentOS Linux release 7.6.1810 (Core) 

# 若Centos版本不在7.5或之上 通過yum更新
$ yum update

主機名解析

為了方便后面集群節點間的直接調用，在這配置一下主機名解析，企業中推薦使用內部DNS服務器。

# 主機名成解析 編輯四台服務器的/etc/hosts文件，添加下面內容
# 注意：主機名不能帶下划線，只能帶中划線
$ vi /etc/hosts
10.80.6.120 k8s-master
10.80.6.121 k8s-node1
10.80.6.122 k8s-node2

時間同步（待定檢測必要性）

kubernetes要求集群中的節點時間必須精確一致，這里直接使用chronyd服務從網絡同步時間；也可以使用網絡授時NTP。

企業中建議配置內部的時間同步服務器。

#若chrony不存在,使用yum安裝
$ yum install -y chrony

# 啟動chronyd服務 若啟動出現錯誤 查看問題匯總中問題10
$ systemctl start chronyd
# 設置chronyd服務開機自啟
$ systemctl enable chronyd
# chronyd服務啟動稍等幾秒鍾，就可以使用date命令驗證時間了
$ date

禁用iptables和firewalld服務

kubernetes和docker在運行中會產生大量的iptables規則，為了不讓系統規則跟它們混淆，直接關閉系統的規則。

# 1 關閉firewalld服務
$ systemctl stop firewalld
$ systemctl disable firewalld
# 2 關閉iptables服務
$ systemctl stop iptables
$ systemctl disable iptables

禁用selinux

selinux是linux系統下的一個安全服務，如果不關閉它，在安裝集群中會產生各種各樣的奇葩問題。

# 編輯 /etc/selinux/config 文件，修改SELINUX的值為disabled
# 注意修改完畢之后需要重啟linux服務
$ vi /etc/selinux/config
SELINUX=disabled

禁用swap分區

swap分區指的是虛擬內存分區，它的作用是在物理內存使用完之后，將磁盤空間虛擬成內存來使用。

啟用swap設備會對系統的性能產生非常負面的影響，因此kubernetes要求每個節點都要禁用swap設備。

但是如果因為某些原因確實不能關閉swap分區，就需要在集群安裝過程中通過明確的參數進行配置說明。

# 編輯分區配置文件/etc/fstab，注釋掉有 `swap`分區 字樣的一行
# 注意修改完畢之后需要重啟linux服務
$ vi /etc/fstab
# /dev/mapper/centos-swap swap                      swap    defaults        0 0

修改linux的內核參數

# 修改linux的內核參數，添加網橋過濾和地址轉發功能
# 出現Can't open file for writing查看問題九
# 編輯/etc/sysctl.d/kubernetes.conf文件，添加如下配置:
$ sudo vi /ect/sysctl.d/kubernetes.conf
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
net.ipv4.ip_forward = 1

# 重新加載配置
$ sysctl -p

# 加載網橋過濾模塊
$ modprobe br_netfilter

# 查看網橋過濾模塊是否加載成功
$ lsmod | grep br_netfilter

配置ipvs功能

在kubernetes中service有兩種代理模型，一種是基於iptables的，一種是基於ipvs的。

兩者比較的話，ipvs的性能明顯要高一些，但是如果要使用它，需要手動載入ipvs模塊。

# 1 安裝ipset和ipvsadm
$ yum install ipset ipvsadm -y

# 2 添加需要加載的模塊寫入腳本文件
$ cat <<EOF >  /etc/sysconfig/modules/ipvs.modules
#!/bin/bash
modprobe -- ip_vs
modprobe -- ip_vs_rr
modprobe -- ip_vs_wrr
modprobe -- ip_vs_sh
modprobe -- nf_conntrack_ipv4
EOF

# 3 為腳本文件添加執行權限
$ chmod +x /etc/sysconfig/modules/ipvs.modules

# 4 執行腳本文件
$ /bin/bash /etc/sysconfig/modules/ipvs.modules

# 5 查看對應的模塊是否加載成功
$ lsmod | grep -e ip_vs -e nf_conntrack_ipv4

重啟服務器

上面步驟完成之后，需要重新啟動linux系統。

$ reboot

安裝docker

# 1 切換鏡像源
$ wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo

# 2 查看當前鏡像源中支持的docker版本
$ yum list docker-ce --showduplicates

# 3 安裝特定版本的docker-ce
# 必須指定--setopt=obsoletes=0，否則yum會自動安裝更高版本
# 安裝其它版本號 版本號可通過 yum list docker-ce --showduplicates查看
# 如果想安裝其它版本 一定要docker-ce-xxx 和 docker-ce-cli-xxx containerd.io 這三個一個都不能缺少
$ yum install --setopt=obsoletes=0 docker-ce-19.03.5 docker-ce-cli-19.03.5 containerd.io -y

# 4 添加一個配置文件
# Docker在默認情況下使用的Cgroup Driver為cgroupfs，而kubernetes推薦使用systemd來代替cgroupfs
$ mkdir /etc/docker
$ cat <<EOF >  /etc/docker/daemon.json
{
  "exec-opts": ["native.cgroupdriver=systemd"],
  "registry-mirrors": ["https://kn0t2bca.mirror.aliyuncs.com"]
}
EOF

# 5 啟動docker
$ systemctl restart docker
$ systemctl enable docker

# 6 檢查docker狀態和版本
$ docker --version
Docker version 19.03.5, build 633a0ea

# 7 查看鏡像加速是否成功 
# 出現xxx.alixxx就成功
$ docker info
Registry Mirrors:
    https://xxx.mirror.aliyuncs.com

安裝kubernetes組件

# 由於kubernetes的鏡像源在國外，速度比較慢，這里切換成國內的鏡像源
# 1.編輯/etc/yum.repos.d/kubernetes.repo，添加下面的配置 
$ vi /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=http://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=http://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg
       http://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg

# 2.查看當前鏡像源中支持的docker版本
# 也可通過 http://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/Packages/   查看版本信息
$ yum list kubectl --showduplicates



# 3.安裝kubeadm、kubelet和kubectl
# kubernetes1.18.8和docker19.03.5適配
$ yum install --setopt=obsoletes=0 kubeadm-1.18.8-0 kubelet-1.18.8-0 kubectl-1.18.8-0 -y

# 配置kubelet的cgroup
# 4.編輯/etc/sysconfig/kubelet，添加下面的配置
$ vi /etc/sysconfig/kubelet
KUBELET_CGROUP_ARGS="--cgroup-driver=systemd"
KUBE_PROXY_MODE="ipvs"

# 5.設置kubelet開機自啟
$ systemctl enable kubelet

准備集群鏡像

# 在安裝kubernetes集群之前，必須要提前准備好集群需要的鏡像，所需鏡像可以通過下面命令查看
$ kubeadm config images list
k8s.gcr.io/kube-apiserver:v1.18.20
k8s.gcr.io/kube-controller-manager:v1.18.20
k8s.gcr.io/kube-scheduler:v1.18.20
k8s.gcr.io/kube-proxy:v1.18.20
k8s.gcr.io/pause:3.2
k8s.gcr.io/etcd:3.4.3-0
k8s.gcr.io/coredns:1.6.7


# 下載鏡像
# 此鏡像在kubernetes的倉庫中,由於網絡原因,無法連接，下面提供了一種替代方案
$ images=(
    kube-apiserver:v1.18.20
    kube-controller-manager:v1.18.20
    kube-scheduler:v1.18.20
    kube-proxy:v1.18.20
    pause:3.2
    etcd:3.4.3-0
    coredns:1.6.7
)

$ for imageName in ${images[@]} ; do
	docker pull registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName
	docker tag registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName 		k8s.gcr.io/$imageName
	docker rmi registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName
done

集群初始化

下面開始對集群進行初始化，並將node節點加入到集群中

下面的操作只需要在master節點上執行即可

#1.查看kubectl 版本信息
$ kubectl version

# apiserver-advertise-address 為k8s-master的ip地址 
# image-repository 由於默認拉取鏡像地址k8s.gcr.io國內無法訪問，這里指定阿里雲鏡像倉庫地址。
# 該操作可能會等待時間較長 可通過docker images 查看鏡像的pull 大致了解鏡像拉取情況
# 出現 Kubernetes control-plane has initialized successfully! 才算成功
# 若出現錯誤,則查看問題匯總
# 將--apiserver-advertise-address=192.168.188.128 使用 --apiserver-advertise-address=$(ip addr|grep ens|awk '{print $2}'|grep '/'| head -c-4)替代
#2.創建集群
$ kubeadm init \
	--kubernetes-version=v1.18.20 \
    --pod-network-cidr=10.244.0.0/16 \
    --service-cidr=10.96.0.0/12 \
    --apiserver-advertise-address=本機的IP地址
#參數說明
--kubernetes-version=v1.18.20: kubernetes版本 可通過kubectl version 查看版本信息
--pod-network-cidr=10.244.0.0/16: pod網關 可默認
--service-cidr=10.96.0.0/12: server網絡 可默認
--apiserver-advertise-address=10.80.6.120: master的ip地址

.....
Your Kubernetes control-plane has initialized successfully!

To start using your cluster, you need to run the following as a regular user:

  mkdir -p $HOME/.kube
  sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
  sudo chown $(id -u):$(id -g) $HOME/.kube/config

You should now deploy a pod network to the cluster.
Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
  https://kubernetes.io/docs/concepts/cluster-administration/addons/

Then you can join any number of worker nodes by running the following on each as root:

kubeadm join 10.80.6.120:6443 --token 8xfehq.bbghn94cpaowmnjb \
    --discovery-token-ca-cert-hash sha256:e51a57f9e4f0205c646a81a0cef402b11ec2f1a82c6ea5a5f0cac8c0a9f5b9c1

使用kubectl工具：

# 這一段為上面 Your Kubernetes control-plane has initialized successfully! 后面的內容
#3.創建必要文件
$ mkdir -p $HOME/.kube
$ sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
$ sudo chown $(id -u):$(id -g) $HOME/.kube/config

#4.獲取節點信息
$ kubectl get nodes
NAME         STATUS     ROLES    AGE     VERSION
k8s-master   Ready    master   13h   v1.18.8

下面的操作只需要在node節點上執行即可

# 將node節點加入集群
$ kubeadm join 10.80.6.120:6443 --token 8xfehq.bbghn94cpaowmnjb \
    --discovery-token-ca-cert-hash sha256:e51a57f9e4f0205c646a81a0cef402b11ec2f1a82c6ea5a5f0cac8c0a9f5b9c1 
	
# 查看集群狀態 此時的集群狀態為NotReady，這是因為還沒有配置網絡插件
$ kubectl get nodes
NAME     STATUS     ROLES    AGE     VERSION
k8s-master   Ready    master   13h   v1.18.8
k8s-node1    Ready    <none>   13h   v1.18.8
k8s-node2    Ready    <none>   13h   v1.18.8

安裝網絡插件

kubernetes支持多種網絡插件，比如flannel、calico、canal等等，任選一種使用即可，本次選擇flannel。

這一步操作是將kubectl get nodes中noteady狀態變為ready狀態的過程。

下面操作依舊只在master節點執行即可，插件使用的是DaemonSet的控制器，它會在每個節點上都運行

這里存在兩種方式，方式一和方式二，若kube-flannel.yml下載失敗，可通過復制kube-flannel.yml並在linux中創建粘貼即可。

方式一：

# 獲取fannel的配置文件
# 修改文件中quay.io倉庫為quay-mirror.qiniu.com
# 這里有時候會下載失敗
$ wget https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
或
$ vi kube-fannel.yml #kube-flannel.yml文件在下面已經給出

# 使用配置文件啟動fannel
$ kubectl apply -f kube-flannel.yml

# 稍等片刻，再次查看集群節點的狀態
# 可能需要等待的時間較長,請耐心等待。也可通過切換到notready 節點中使用docker ps 查看鏡像啟動信息
# 若很長時間都是notready可通過kubectl查看日志
$ kubectl get nodes
NAME     STATUS   ROLES    AGE     VERSION
k8s-master   Ready    master   13h   v1.18.8
k8s-node1    Ready    <none>   13h   v1.18.8
k8s-node2    Ready    <none>   13h   v1.18.8

kube-flannel.yml文件

---
kind: Namespace
apiVersion: v1
metadata:
  name: kube-flannel
  labels:
    pod-security.kubernetes.io/enforce: privileged
---
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1
metadata:
  name: flannel
rules:
- apiGroups:
  - ""
  resources:
  - pods
  verbs:
  - get
- apiGroups:
  - ""
  resources:
  - nodes
  verbs:
  - list
  - watch
- apiGroups:
  - ""
  resources:
  - nodes/status
  verbs:
  - patch
---
kind: ClusterRoleBinding
apiVersion: rbac.authorization.k8s.io/v1
metadata:
  name: flannel
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: flannel
subjects:
- kind: ServiceAccount
  name: flannel
  namespace: kube-flannel
---
apiVersion: v1
kind: ServiceAccount
metadata:
  name: flannel
  namespace: kube-flannel
---
kind: ConfigMap
apiVersion: v1
metadata:
  name: kube-flannel-cfg
  namespace: kube-flannel
  labels:
    tier: node
    app: flannel
data:
  cni-conf.json: |
    {
      "name": "cbr0",
      "cniVersion": "0.3.1",
      "plugins": [
        {
          "type": "flannel",
          "delegate": {
            "hairpinMode": true,
            "isDefaultGateway": true
          }
        },
        {
          "type": "portmap",
          "capabilities": {
            "portMappings": true
          }
        }
      ]
    }
  net-conf.json: |
    {
      "Network": "10.244.0.0/16",
      "Backend": {
        "Type": "vxlan"
      }
    }
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: kube-flannel-ds
  namespace: kube-flannel
  labels:
    tier: node
    app: flannel
spec:
  selector:
    matchLabels:
      app: flannel
  template:
    metadata:
      labels:
        tier: node
        app: flannel
    spec:
      affinity:
        nodeAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:
            nodeSelectorTerms:
            - matchExpressions:
              - key: kubernetes.io/os
                operator: In
                values:
                - linux
      hostNetwork: true
      priorityClassName: system-node-critical
      tolerations:
      - operator: Exists
        effect: NoSchedule
      serviceAccountName: flannel
      initContainers:
      - name: install-cni-plugin
       #image: flannelcni/flannel-cni-plugin:v1.1.0 for ppc64le and mips64le (dockerhub limitations may apply)
        image: docker.io/rancher/mirrored-flannelcni-flannel-cni-plugin:v1.1.0
        command:
        - cp
        args:
        - -f
        - /flannel
        - /opt/cni/bin/flannel
        volumeMounts:
        - name: cni-plugin
          mountPath: /opt/cni/bin
      - name: install-cni
       #image: flannelcni/flannel:v0.20.1 for ppc64le and mips64le (dockerhub limitations may apply)
        image: docker.io/rancher/mirrored-flannelcni-flannel:v0.20.1
        command:
        - cp
        args:
        - -f
        - /etc/kube-flannel/cni-conf.json
        - /etc/cni/net.d/10-flannel.conflist
        volumeMounts:
        - name: cni
          mountPath: /etc/cni/net.d
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      containers:
      - name: kube-flannel
       #image: flannelcni/flannel:v0.20.1 for ppc64le and mips64le (dockerhub limitations may apply)
        image: docker.io/rancher/mirrored-flannelcni-flannel:v0.20.1
        command:
        - /opt/bin/flanneld
        args:
        - --ip-masq
        - --kube-subnet-mgr
        resources:
          requests:
            cpu: "100m"
            memory: "50Mi"
          limits:
            cpu: "100m"
            memory: "50Mi"
        securityContext:
          privileged: false
          capabilities:
            add: ["NET_ADMIN", "NET_RAW"]
        env:
        - name: POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: POD_NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        - name: EVENT_QUEUE_DEPTH
          value: "5000"
        volumeMounts:
        - name: run
          mountPath: /run/flannel
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
        - name: xtables-lock
          mountPath: /run/xtables.lock
      volumes:
      - name: run
        hostPath:
          path: /run/flannel
      - name: cni-plugin
        hostPath:
          path: /opt/cni/bin
      - name: cni
        hostPath:
          path: /etc/cni/net.d
      - name: flannel-cfg
        configMap:
          name: kube-flannel-cfg
      - name: xtables-lock
        hostPath:
          path: /run/xtables.lock
          type: FileOrCreate

方式二：

$ kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml

# 稍等片刻，再次查看集群節點的狀態
# 可能需要等待的時間較長,請耐心等待。也可通過切換到notready 節點中使用docker ps 查看鏡像啟動信息
# 若很長時間都是notready可通過kubectl查看日志
$ kubectl get nodes
NAME     STATUS   ROLES    AGE     VERSION
k8s-master   Ready    master   13h   v1.18.8
k8s-node1    Ready    <none>   13h   v1.18.8
k8s-node2    Ready    <none>   13h   v1.18.8

至此，kubernetes的集群環境搭建完成。

服務部署

所有操作都是通過master節點操作，而不需要到node節點上操作。

# 部署nginx
$ kubectl create deployment nginx --image=nginx:1.14-alpine
deployment.apps/nginx created

# 暴露端口
$ kubectl expose deployment nginx --port=80 --type=NodePort
service/nginx exposed

# 查看服務狀態
$ kubectl get pods,service
NAME                         READY   STATUS    RESTARTS   AGE
pod/nginx-55f8fd7cfc-wvdxq   1/1     Running   0          30m

NAME                 TYPE        CLUSTER-IP     EXTERNAL-IP   PORT(S)        AGE
service/kubernetes   ClusterIP   10.96.0.1      <none>        443/TCP        35m
service/nginx        NodePort    10.107.52.75   <none>        80:30983/TCP   30m


# 4 最后在電腦上訪問下部署的nginx服務

問題匯總

問題一：

問題描述：

在K8S-Master中執行 kubeadm init...出現以下錯誤

W0112 22:25:15.385511   18569 configset.go:202] WARNING: kubeadm cannot validate component configs for API groups [kubelet.config.k8s.io kubeproxy.config.k8s.io]
[init] Using Kubernetes version: v1.18.0
[preflight] Running pre-flight checks
	[WARNING IsDockerSystemdCheck]: detected "cgroupfs" as the Docker cgroup driver. The recommended driver is "systemd". Please follow the guide at https://kubernetes.io/docs/setup/cri/
error execution phase preflight: [preflight] Some fatal errors occurred:
	[ERROR Swap]: running with swap on is not supported. Please disable swap
[preflight] If you know what you are doing, you can make a check non-fatal with `--ignore-preflight-errors=...`
To see the stack trace of this error execute with --v=5 or higher

問題原因：

問題解決：

#1.修改docker.service
$ vi /usr/lib/systemd/system/docker.service
#修改成如下內容
ExecStart=/usr/bin/dockerd --exec-opt native.cgroupdriver=systemd

#2.重啟docker
$ systemctl daemon-reload && systemctl restart docker

問題二：

問題描述：

在K8S-Master中執行 kubeadm init...出現以下錯誤

W0112 22:28:21.715514   18853 configset.go:202] WARNING: kubeadm cannot validate component configs for API groups [kubelet.config.k8s.io kubeproxy.config.k8s.io]
[init] Using Kubernetes version: v1.18.0
[preflight] Running pre-flight checks
error execution phase preflight: [preflight] Some fatal errors occurred:
	[ERROR Swap]: running with swap on is not supported. Please disable swap
[preflight] If you know what you are doing, you can make a check non-fatal with `--ignore-preflight-errors=...`
To see the stack trace of this error execute with --v=5 or higher

問題原因：

running with swap on is not supported. Please disable swap 關閉swap;

問題解決：

$ sed -ri 's/.*swap.*/#&/' /etc/fstab

問題三：

問題描述：

for imageName in ${images[@]} ; do安裝kubernetes鏡像時，docker出現卡住的現象。出現以下問題

597de8ba0c30: Already exists 
3f0663684f29: Pull complete 
e1f7f878905c: Pull complete 
3029977cf65d: Pulling fs layer

問題原因：

可能時網絡問題，可能時其它原因。

問題解決：

重啟docker

$ systemctl restart docker

刪除docker的緩存；docker拉取的的鏡像是存放在/var/lib/docker/overlay2，緩存是在/var/lib/docker/tmp，但是我都刪掉反而報錯有其中有的東西不能刪；

//TODO 待定

問題四：

問題描述：

在master執行kubeadm init --kubernetes-version=xxx..命令后,出現以下錯誤

Unable to connect to the server: x509: certificate signed by unknown authority

問題原因：

刪除集群然后重新創建也算是一個常規的操作，如果你在執行 kubeadm reset命令后沒有刪除創建的 $HOME/.kube目錄，重新創建集群就會出現這個問題！

問題解決：

# 在執行這幾個命令前先執行rm -rf $HOME/.kube命令刪除這個目錄
$ mkdir -p $HOME/.kube
$ sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
$ sudo chown $(id -u):$(id -g) $HOME/.kube/config

問題五：

問題描述：

在子節點執行kubeadm join命令后返回 error uploading crisocket: timed out waiting for the condition

[kubelet-check] The HTTP call equal to 'curl -sSL http://localhost:10248/healthz' failed with error: Get http://localhost:10248/healthz: dial tcp [::1]:10248: connect: connection refused.

error execution phase kubelet-start: error uploading crisocket: timed out waiting for the condition
To see the stack trace of this error execute with --v=5 or higher

問題原因：

問題解決：

$ swapoff -a 
$ kubeadm reset
$ systemctl daemon-reload
$ systemctl restart kubelet
$ iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X

以上執行完成后再執行加入子結點的操作：

kubeadm join 10.80.6.120:6443 --token f4ls6h.ogl776zklkoeqei9 \
    --discovery-token-ca-cert-hash sha256:96ec68a8116024da03a763c0af61fbd933615d93949d9c3b01c952af0193f149

問題六：

問題描述：

在子節點執行kubeadm join命令后返回 /etc/kubernetes/kubelet.conf already exists等問題。

error execution phase preflight: [preflight] Some fatal errors occurred:
	[ERROR FileAvailable--etc-kubernetes-kubelet.conf]: /etc/kubernetes/kubelet.conf already exists
	[ERROR FileAvailable--etc-kubernetes-pki-ca.crt]: /etc/kubernetes/pki/ca.crt already exists

問題原因：

原來舊的配置文件都存在了，所以無法kubeadm join到master中。

問題解決：

把/etc/kubernetes/kubelet.conf和/etc/kubernetes/pki/ca.crt刪除即可

$ rm -f /etc/kubernetes/kubelet.conf /etc/kubernetes/pki/ca.crt

問題七：

問題描述：

安裝k8s時出現以下錯誤，

could not convert cfg to an internal cfg: nodeRegistration.name: Invalid value: "k8s_master": a DNS-1123 subdomain must consist of lower case alphanumeric characters, '-' or '.', and must start and end with an alphanumeric character (e.g. 'example.com', regex used for validation is '[a-z0-9]([-a-z0-9]*[a-z0-9])?(\.[a-z0-9]([-a-z0-9]*[a-z0-9])?)*')

問題原因：

這是因為主機名不能帶下划線，只能帶中划線。

問題解決：

將主機名的 下划線`_` 改為 中划線`-` 即可

問題八：

問題描述：

修改linux的內核參數時，保存/etc/sysctl.d/kubernetes.conf文件時，出現Can't open file for writing錯誤

問題原因：

可能一個原因是權限不夠，使用root解決

問題解決：

$ su root
$ vi /etc/sysctl.d/kubernetes.conf

問題九：

問題描述：

通過yum -y install chrony后，使用systemctl start chronyd時出現Job for chronyd.service failed because the control process exited with error code. See "systemctl status chronyd.service" and "journalctl -xe" for details.

問題原因：

使用 yum -y install chrony命令，自動安裝了最新版的chrony服務（配套7.7內核）。由於我的系統是7.3，可能不兼容高版本的chrony服務，導致服務啟動失敗。（個人理解猜測）

問題解決：