集群環境搭建
搭建kubernetes的集群環境
環境規划
集群類型
kubernetes集群大體上分為兩類:一主多從和多主多從。
- 一主多從:一台Master節點和多台Node節點,搭建簡單,但是有單機故障風險,適合用於測試環境
- 多主多從:多台Master節點和多台Node節點,搭建麻煩,安全性高,適合用於生產環境
安裝方式
kubernetes有多種部署方式,目前主流的方式有kubeadm、minikube、二進制包
- minikube:一個用於快速搭建單節點kubernetes的工具
- kubeadm:一個用於快速搭建kubernetes集群的工具
- 二進制包 :從官網下載每個組件的二進制包,依次去安裝,此方式對於理解kubernetes組件更加有效
主機規划
這里推薦使用Centos7.6.1810
的系統,其它系統可能會出現意想不到的問題。如使用Centos7.3
的系統會出現 網絡同步Chronyd
啟動不成功問題,Centos7.x可以通過yum update
來升級內核。
作用 | IP地址 | 操作系統 | 配置 |
---|---|---|---|
k8s-Master | 10.80.6.120 | Centos7.6.1810 | 8H/8G 50G |
k8s-Node1 | 10.80.6.121 | Centos7.6.1810 | 8H/8G 50G |
k8s-Node2 | 10.80.6.122 | Centos7.6.1810 | 8H/8G 50G |
環境搭建
本次環境搭建需要安裝四台Centos服務器(一主三從),然后在每台服務器中分別安裝docker(19.03.5),kubeadm(1.18.8)、kubelet(1.18.8)、kubectl(1.18.8)程序。
可能通過kubectl查看版本時會變成1.18.20 並不影響使用。1.18.20一樣也適配docker(19.03.5)
如果需要別的版本可以自行查詢K8s和Docker版本的適配。
主機安裝
安裝虛擬機過程中注意下面選項的設置:
- 操作系統環境:CPU(2H) 內存(8G) 硬盤(30G)
- 語言選擇:中文簡體
- 軟件選擇:基礎設施服務器
- 分區選擇:自動分區
- 網絡配置:按照下面配置網路地址信息
# 要查看自己本機的 IP地址(IPADDR)、掩碼地址(NETMASK)、網關(GATEWAY)、DNS地址 然后填上去
$ vi /etc/sysconfig/network-scripts/ifcfg-ensxxx
BOOTPROTO=static
ONBOOT=yes
IPADDR=10.80.6.120
NETWASK=255.255.0.0
GATEWAY=10.80.6.1
DNS1=114.114.114.114
DNS2=10.80.6.1
DNS3=8.8.8.8
- 主機名設置:按照下面信息設置主機名
master$ hostnamectl set-hostname k8s-master #master節點: k8s-master
node1$ hostnamectl set-hostname k8s-node1 #node1節點: k8s-node1
node2$ hostnamectl set-hostname k8s-node2 #node2節點: k8s-node2
環境初始化
- 更換鏡像源
#創建sh腳本,將以下內容粘貼到reposintall.sh里
$ vi reposinstall.sh
#!/bin/bash
cd /etc/yum.repos.d/
mkdir repo_bak
mv *.repo repo_bak/
curl -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repo
yum clean all
yum makecache
yum install -y epel-release.noarch
yum clean all
yum makecache
yum repolist all
$ sh reposinstall.sh
.......
- 檢查操作系統的版本
# 此方式下安裝kubernetes集群要求Centos版本要在7.5或之上
$ cat /etc/redhat-release
CentOS Linux release 7.6.1810 (Core)
# 若Centos版本不在7.5或之上 通過yum更新
$ yum update
- 主機名解析
為了方便后面集群節點間的直接調用,在這配置一下主機名解析,企業中推薦使用內部DNS服務器。
# 主機名成解析 編輯四台服務器的/etc/hosts文件,添加下面內容
# 注意:主機名不能帶下划線,只能帶中划線
$ vi /etc/hosts
10.80.6.120 k8s-master
10.80.6.121 k8s-node1
10.80.6.122 k8s-node2
- 時間同步(待定檢測必要性)
kubernetes要求集群中的節點時間必須精確一致,這里直接使用chronyd服務從網絡同步時間;也可以使用網絡授時NTP
。
企業中建議配置內部的時間同步服務器。
#若chrony不存在,使用yum安裝
$ yum install -y chrony
# 啟動chronyd服務 若啟動出現錯誤 查看問題匯總中問題10
$ systemctl start chronyd
# 設置chronyd服務開機自啟
$ systemctl enable chronyd
# chronyd服務啟動稍等幾秒鍾,就可以使用date命令驗證時間了
$ date
- 禁用iptables和firewalld服務
kubernetes和docker在運行中會產生大量的iptables規則,為了不讓系統規則跟它們混淆,直接關閉系統的規則。
# 1 關閉firewalld服務
$ systemctl stop firewalld
$ systemctl disable firewalld
# 2 關閉iptables服務
$ systemctl stop iptables
$ systemctl disable iptables
- 禁用selinux
selinux是linux系統下的一個安全服務,如果不關閉它,在安裝集群中會產生各種各樣的奇葩問題。
# 編輯 /etc/selinux/config 文件,修改SELINUX的值為disabled
# 注意修改完畢之后需要重啟linux服務
$ vi /etc/selinux/config
SELINUX=disabled
- 禁用swap分區
swap分區指的是虛擬內存分區,它的作用是在物理內存使用完之后,將磁盤空間虛擬成內存來使用。
啟用swap設備會對系統的性能產生非常負面的影響,因此kubernetes要求每個節點都要禁用swap設備。
但是如果因為某些原因確實不能關閉swap分區,就需要在集群安裝過程中通過明確的參數進行配置說明。
# 編輯分區配置文件/etc/fstab,注釋掉有 `swap`分區 字樣的一行
# 注意修改完畢之后需要重啟linux服務
$ vi /etc/fstab
# /dev/mapper/centos-swap swap swap defaults 0 0
- 修改linux的內核參數
# 修改linux的內核參數,添加網橋過濾和地址轉發功能
# 出現Can't open file for writing查看問題九
# 編輯/etc/sysctl.d/kubernetes.conf文件,添加如下配置:
$ sudo vi /ect/sysctl.d/kubernetes.conf
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
net.ipv4.ip_forward = 1
# 重新加載配置
$ sysctl -p
# 加載網橋過濾模塊
$ modprobe br_netfilter
# 查看網橋過濾模塊是否加載成功
$ lsmod | grep br_netfilter
- 配置ipvs功能
在kubernetes中service有兩種代理模型,一種是基於iptables的,一種是基於ipvs的。
兩者比較的話,ipvs的性能明顯要高一些,但是如果要使用它,需要手動載入ipvs模塊。
# 1 安裝ipset和ipvsadm
$ yum install ipset ipvsadm -y
# 2 添加需要加載的模塊寫入腳本文件
$ cat <<EOF > /etc/sysconfig/modules/ipvs.modules
#!/bin/bash
modprobe -- ip_vs
modprobe -- ip_vs_rr
modprobe -- ip_vs_wrr
modprobe -- ip_vs_sh
modprobe -- nf_conntrack_ipv4
EOF
# 3 為腳本文件添加執行權限
$ chmod +x /etc/sysconfig/modules/ipvs.modules
# 4 執行腳本文件
$ /bin/bash /etc/sysconfig/modules/ipvs.modules
# 5 查看對應的模塊是否加載成功
$ lsmod | grep -e ip_vs -e nf_conntrack_ipv4
- 重啟服務器
上面步驟完成之后,需要重新啟動linux系統。
$ reboot
安裝docker
# 1 切換鏡像源
$ wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo
# 2 查看當前鏡像源中支持的docker版本
$ yum list docker-ce --showduplicates
# 3 安裝特定版本的docker-ce
# 必須指定--setopt=obsoletes=0,否則yum會自動安裝更高版本
# 安裝其它版本號 版本號可通過 yum list docker-ce --showduplicates查看
# 如果想安裝其它版本 一定要docker-ce-xxx 和 docker-ce-cli-xxx containerd.io 這三個一個都不能缺少
$ yum install --setopt=obsoletes=0 docker-ce-19.03.5 docker-ce-cli-19.03.5 containerd.io -y
# 4 添加一個配置文件
# Docker在默認情況下使用的Cgroup Driver為cgroupfs,而kubernetes推薦使用systemd來代替cgroupfs
$ mkdir /etc/docker
$ cat <<EOF > /etc/docker/daemon.json
{
"exec-opts": ["native.cgroupdriver=systemd"],
"registry-mirrors": ["https://kn0t2bca.mirror.aliyuncs.com"]
}
EOF
# 5 啟動docker
$ systemctl restart docker
$ systemctl enable docker
# 6 檢查docker狀態和版本
$ docker --version
Docker version 19.03.5, build 633a0ea
# 7 查看鏡像加速是否成功
# 出現xxx.alixxx就成功
$ docker info
Registry Mirrors:
https://xxx.mirror.aliyuncs.com
安裝kubernetes組件
# 由於kubernetes的鏡像源在國外,速度比較慢,這里切換成國內的鏡像源
# 1.編輯/etc/yum.repos.d/kubernetes.repo,添加下面的配置
$ vi /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=http://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=http://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg
http://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
# 2.查看當前鏡像源中支持的docker版本
# 也可通過 http://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/Packages/ 查看版本信息
$ yum list kubectl --showduplicates
# 3.安裝kubeadm、kubelet和kubectl
# kubernetes1.18.8和docker19.03.5適配
$ yum install --setopt=obsoletes=0 kubeadm-1.18.8-0 kubelet-1.18.8-0 kubectl-1.18.8-0 -y
# 配置kubelet的cgroup
# 4.編輯/etc/sysconfig/kubelet,添加下面的配置
$ vi /etc/sysconfig/kubelet
KUBELET_CGROUP_ARGS="--cgroup-driver=systemd"
KUBE_PROXY_MODE="ipvs"
# 5.設置kubelet開機自啟
$ systemctl enable kubelet
准備集群鏡像
# 在安裝kubernetes集群之前,必須要提前准備好集群需要的鏡像,所需鏡像可以通過下面命令查看
$ kubeadm config images list
k8s.gcr.io/kube-apiserver:v1.18.20
k8s.gcr.io/kube-controller-manager:v1.18.20
k8s.gcr.io/kube-scheduler:v1.18.20
k8s.gcr.io/kube-proxy:v1.18.20
k8s.gcr.io/pause:3.2
k8s.gcr.io/etcd:3.4.3-0
k8s.gcr.io/coredns:1.6.7
# 下載鏡像
# 此鏡像在kubernetes的倉庫中,由於網絡原因,無法連接,下面提供了一種替代方案
$ images=(
kube-apiserver:v1.18.20
kube-controller-manager:v1.18.20
kube-scheduler:v1.18.20
kube-proxy:v1.18.20
pause:3.2
etcd:3.4.3-0
coredns:1.6.7
)
$ for imageName in ${images[@]} ; do
docker pull registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName
docker tag registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName k8s.gcr.io/$imageName
docker rmi registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName
done
集群初始化
下面開始對集群進行初始化,並將node節點加入到集群中
下面的操作只需要在
master
節點上執行即可
#1.查看kubectl 版本信息
$ kubectl version
# apiserver-advertise-address 為k8s-master的ip地址
# image-repository 由於默認拉取鏡像地址k8s.gcr.io國內無法訪問,這里指定阿里雲鏡像倉庫地址。
# 該操作可能會等待時間較長 可通過docker images 查看鏡像的pull 大致了解鏡像拉取情況
# 出現 Kubernetes control-plane has initialized successfully! 才算成功
# 若出現錯誤,則查看問題匯總
# 將--apiserver-advertise-address=192.168.188.128 使用 --apiserver-advertise-address=$(ip addr|grep ens|awk '{print $2}'|grep '/'| head -c-4)替代
#2.創建集群
$ kubeadm init \
--kubernetes-version=v1.18.20 \
--pod-network-cidr=10.244.0.0/16 \
--service-cidr=10.96.0.0/12 \
--apiserver-advertise-address=本機的IP地址
#參數說明
--kubernetes-version=v1.18.20: kubernetes版本 可通過kubectl version 查看版本信息
--pod-network-cidr=10.244.0.0/16: pod網關 可默認
--service-cidr=10.96.0.0/12: server網絡 可默認
--apiserver-advertise-address=10.80.6.120: master的ip地址
.....
Your Kubernetes control-plane has initialized successfully!
To start using your cluster, you need to run the following as a regular user:
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
You should now deploy a pod network to the cluster.
Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
https://kubernetes.io/docs/concepts/cluster-administration/addons/
Then you can join any number of worker nodes by running the following on each as root:
kubeadm join 10.80.6.120:6443 --token 8xfehq.bbghn94cpaowmnjb \
--discovery-token-ca-cert-hash sha256:e51a57f9e4f0205c646a81a0cef402b11ec2f1a82c6ea5a5f0cac8c0a9f5b9c1
使用kubectl工具:
# 這一段為上面 Your Kubernetes control-plane has initialized successfully! 后面的內容
#3.創建必要文件
$ mkdir -p $HOME/.kube
$ sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
$ sudo chown $(id -u):$(id -g) $HOME/.kube/config
#4.獲取節點信息
$ kubectl get nodes
NAME STATUS ROLES AGE VERSION
k8s-master Ready master 13h v1.18.8
下面的操作只需要在
node
節點上執行即可
# 將node節點加入集群
$ kubeadm join 10.80.6.120:6443 --token 8xfehq.bbghn94cpaowmnjb \
--discovery-token-ca-cert-hash sha256:e51a57f9e4f0205c646a81a0cef402b11ec2f1a82c6ea5a5f0cac8c0a9f5b9c1
# 查看集群狀態 此時的集群狀態為NotReady,這是因為還沒有配置網絡插件
$ kubectl get nodes
NAME STATUS ROLES AGE VERSION
k8s-master Ready master 13h v1.18.8
k8s-node1 Ready <none> 13h v1.18.8
k8s-node2 Ready <none> 13h v1.18.8
安裝網絡插件
kubernetes支持多種網絡插件,比如flannel、calico、canal等等,任選一種使用即可,本次選擇flannel。
這一步操作是將kubectl get nodes
中noteady
狀態變為ready
狀態的過程。
下面操作依舊只在
master
節點執行即可,插件使用的是DaemonSet的控制器,它會在每個節點上都運行
這里存在兩種方式,方式一
和方式二
,若kube-flannel.yml下載失敗,可通過復制kube-flannel.yml
並在linux中創建粘貼即可。
方式一:
# 獲取fannel的配置文件
# 修改文件中quay.io倉庫為quay-mirror.qiniu.com
# 這里有時候會下載失敗
$ wget https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
或
$ vi kube-fannel.yml #kube-flannel.yml文件在下面已經給出
# 使用配置文件啟動fannel
$ kubectl apply -f kube-flannel.yml
# 稍等片刻,再次查看集群節點的狀態
# 可能需要等待的時間較長,請耐心等待。也可通過切換到notready 節點中使用docker ps 查看鏡像啟動信息
# 若很長時間都是notready可通過kubectl查看日志
$ kubectl get nodes
NAME STATUS ROLES AGE VERSION
k8s-master Ready master 13h v1.18.8
k8s-node1 Ready <none> 13h v1.18.8
k8s-node2 Ready <none> 13h v1.18.8
kube-flannel.yml
文件
---
kind: Namespace
apiVersion: v1
metadata:
name: kube-flannel
labels:
pod-security.kubernetes.io/enforce: privileged
---
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1
metadata:
name: flannel
rules:
- apiGroups:
- ""
resources:
- pods
verbs:
- get
- apiGroups:
- ""
resources:
- nodes
verbs:
- list
- watch
- apiGroups:
- ""
resources:
- nodes/status
verbs:
- patch
---
kind: ClusterRoleBinding
apiVersion: rbac.authorization.k8s.io/v1
metadata:
name: flannel
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: flannel
subjects:
- kind: ServiceAccount
name: flannel
namespace: kube-flannel
---
apiVersion: v1
kind: ServiceAccount
metadata:
name: flannel
namespace: kube-flannel
---
kind: ConfigMap
apiVersion: v1
metadata:
name: kube-flannel-cfg
namespace: kube-flannel
labels:
tier: node
app: flannel
data:
cni-conf.json: |
{
"name": "cbr0",
"cniVersion": "0.3.1",
"plugins": [
{
"type": "flannel",
"delegate": {
"hairpinMode": true,
"isDefaultGateway": true
}
},
{
"type": "portmap",
"capabilities": {
"portMappings": true
}
}
]
}
net-conf.json: |
{
"Network": "10.244.0.0/16",
"Backend": {
"Type": "vxlan"
}
}
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
name: kube-flannel-ds
namespace: kube-flannel
labels:
tier: node
app: flannel
spec:
selector:
matchLabels:
app: flannel
template:
metadata:
labels:
tier: node
app: flannel
spec:
affinity:
nodeAffinity:
requiredDuringSchedulingIgnoredDuringExecution:
nodeSelectorTerms:
- matchExpressions:
- key: kubernetes.io/os
operator: In
values:
- linux
hostNetwork: true
priorityClassName: system-node-critical
tolerations:
- operator: Exists
effect: NoSchedule
serviceAccountName: flannel
initContainers:
- name: install-cni-plugin
#image: flannelcni/flannel-cni-plugin:v1.1.0 for ppc64le and mips64le (dockerhub limitations may apply)
image: docker.io/rancher/mirrored-flannelcni-flannel-cni-plugin:v1.1.0
command:
- cp
args:
- -f
- /flannel
- /opt/cni/bin/flannel
volumeMounts:
- name: cni-plugin
mountPath: /opt/cni/bin
- name: install-cni
#image: flannelcni/flannel:v0.20.1 for ppc64le and mips64le (dockerhub limitations may apply)
image: docker.io/rancher/mirrored-flannelcni-flannel:v0.20.1
command:
- cp
args:
- -f
- /etc/kube-flannel/cni-conf.json
- /etc/cni/net.d/10-flannel.conflist
volumeMounts:
- name: cni
mountPath: /etc/cni/net.d
- name: flannel-cfg
mountPath: /etc/kube-flannel/
containers:
- name: kube-flannel
#image: flannelcni/flannel:v0.20.1 for ppc64le and mips64le (dockerhub limitations may apply)
image: docker.io/rancher/mirrored-flannelcni-flannel:v0.20.1
command:
- /opt/bin/flanneld
args:
- --ip-masq
- --kube-subnet-mgr
resources:
requests:
cpu: "100m"
memory: "50Mi"
limits:
cpu: "100m"
memory: "50Mi"
securityContext:
privileged: false
capabilities:
add: ["NET_ADMIN", "NET_RAW"]
env:
- name: POD_NAME
valueFrom:
fieldRef:
fieldPath: metadata.name
- name: POD_NAMESPACE
valueFrom:
fieldRef:
fieldPath: metadata.namespace
- name: EVENT_QUEUE_DEPTH
value: "5000"
volumeMounts:
- name: run
mountPath: /run/flannel
- name: flannel-cfg
mountPath: /etc/kube-flannel/
- name: xtables-lock
mountPath: /run/xtables.lock
volumes:
- name: run
hostPath:
path: /run/flannel
- name: cni-plugin
hostPath:
path: /opt/cni/bin
- name: cni
hostPath:
path: /etc/cni/net.d
- name: flannel-cfg
configMap:
name: kube-flannel-cfg
- name: xtables-lock
hostPath:
path: /run/xtables.lock
type: FileOrCreate
方式二:
$ kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
# 稍等片刻,再次查看集群節點的狀態
# 可能需要等待的時間較長,請耐心等待。也可通過切換到notready 節點中使用docker ps 查看鏡像啟動信息
# 若很長時間都是notready可通過kubectl查看日志
$ kubectl get nodes
NAME STATUS ROLES AGE VERSION
k8s-master Ready master 13h v1.18.8
k8s-node1 Ready <none> 13h v1.18.8
k8s-node2 Ready <none> 13h v1.18.8
至此,kubernetes的集群環境搭建完成。
服務部署
所有操作都是通過master節點操作,而不需要到node節點上操作。
# 部署nginx
$ kubectl create deployment nginx --image=nginx:1.14-alpine
deployment.apps/nginx created
# 暴露端口
$ kubectl expose deployment nginx --port=80 --type=NodePort
service/nginx exposed
# 查看服務狀態
$ kubectl get pods,service
NAME READY STATUS RESTARTS AGE
pod/nginx-55f8fd7cfc-wvdxq 1/1 Running 0 30m
NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
service/kubernetes ClusterIP 10.96.0.1 <none> 443/TCP 35m
service/nginx NodePort 10.107.52.75 <none> 80:30983/TCP 30m
# 4 最后在電腦上訪問下部署的nginx服務
問題匯總
問題一:
問題描述:
在K8S-Master中執行 kubeadm init...
出現以下錯誤
W0112 22:25:15.385511 18569 configset.go:202] WARNING: kubeadm cannot validate component configs for API groups [kubelet.config.k8s.io kubeproxy.config.k8s.io]
[init] Using Kubernetes version: v1.18.0
[preflight] Running pre-flight checks
[WARNING IsDockerSystemdCheck]: detected "cgroupfs" as the Docker cgroup driver. The recommended driver is "systemd". Please follow the guide at https://kubernetes.io/docs/setup/cri/
error execution phase preflight: [preflight] Some fatal errors occurred:
[ERROR Swap]: running with swap on is not supported. Please disable swap
[preflight] If you know what you are doing, you can make a check non-fatal with `--ignore-preflight-errors=...`
To see the stack trace of this error execute with --v=5 or higher
問題原因:
問題解決:
#1.修改docker.service
$ vi /usr/lib/systemd/system/docker.service
#修改成如下內容
ExecStart=/usr/bin/dockerd --exec-opt native.cgroupdriver=systemd
#2.重啟docker
$ systemctl daemon-reload && systemctl restart docker
問題二:
問題描述:
在K8S-Master中執行 kubeadm init...
出現以下錯誤
W0112 22:28:21.715514 18853 configset.go:202] WARNING: kubeadm cannot validate component configs for API groups [kubelet.config.k8s.io kubeproxy.config.k8s.io]
[init] Using Kubernetes version: v1.18.0
[preflight] Running pre-flight checks
error execution phase preflight: [preflight] Some fatal errors occurred:
[ERROR Swap]: running with swap on is not supported. Please disable swap
[preflight] If you know what you are doing, you can make a check non-fatal with `--ignore-preflight-errors=...`
To see the stack trace of this error execute with --v=5 or higher
問題原因:
running with swap on is not supported. Please disable swap 關閉swap;
問題解決:
$ sed -ri 's/.*swap.*/#&/' /etc/fstab
問題三:
問題描述:
for imageName in ${images[@]} ; do
安裝kubernetes鏡像時,docker出現卡住的現象。出現以下問題
597de8ba0c30: Already exists
3f0663684f29: Pull complete
e1f7f878905c: Pull complete
3029977cf65d: Pulling fs layer
問題原因:
可能時網絡問題,可能時其它原因。
問題解決:
- 重啟docker
$ systemctl restart docker
- 刪除docker的緩存;docker拉取的的鏡像是存放在/var/lib/docker/overlay2,緩存是在/var/lib/docker/tmp,但是我都刪掉反而報錯有其中有的東西不能刪;
//TODO 待定
問題四:
問題描述:
在master執行kubeadm init --kubernetes-version=xxx..
命令后,出現以下錯誤
Unable to connect to the server: x509: certificate signed by unknown authority
問題原因:
刪除集群然后重新創建也算是一個常規的操作,如果你在執行 kubeadm reset
命令后沒有刪除創建的 $HOME/.kube
目錄,重新創建集群就會出現這個問題!
問題解決:
# 在執行這幾個命令前先執行rm -rf $HOME/.kube命令刪除這個目錄
$ mkdir -p $HOME/.kube
$ sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
$ sudo chown $(id -u):$(id -g) $HOME/.kube/config
問題五:
問題描述:
在子節點執行kubeadm join命令后返回 error uploading crisocket: timed out waiting for the condition
[kubelet-check] The HTTP call equal to 'curl -sSL http://localhost:10248/healthz' failed with error: Get http://localhost:10248/healthz: dial tcp [::1]:10248: connect: connection refused.
error execution phase kubelet-start: error uploading crisocket: timed out waiting for the condition
To see the stack trace of this error execute with --v=5 or higher
問題原因:
問題解決:
$ swapoff -a
$ kubeadm reset
$ systemctl daemon-reload
$ systemctl restart kubelet
$ iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X
以上執行完成后再執行加入子結點的操作:
kubeadm join 10.80.6.120:6443 --token f4ls6h.ogl776zklkoeqei9 \
--discovery-token-ca-cert-hash sha256:96ec68a8116024da03a763c0af61fbd933615d93949d9c3b01c952af0193f149
問題六:
問題描述:
在子節點執行kubeadm join命令后返回 /etc/kubernetes/kubelet.conf already exists
等問題。
error execution phase preflight: [preflight] Some fatal errors occurred:
[ERROR FileAvailable--etc-kubernetes-kubelet.conf]: /etc/kubernetes/kubelet.conf already exists
[ERROR FileAvailable--etc-kubernetes-pki-ca.crt]: /etc/kubernetes/pki/ca.crt already exists
問題原因:
原來舊的配置文件都存在了,所以無法kubeadm join到master中。
問題解決:
把/etc/kubernetes/kubelet.conf
和/etc/kubernetes/pki/ca.crt
刪除即可
$ rm -f /etc/kubernetes/kubelet.conf /etc/kubernetes/pki/ca.crt
問題七:
問題描述:
安裝k8s時出現以下錯誤,
could not convert cfg to an internal cfg: nodeRegistration.name: Invalid value: "k8s_master": a DNS-1123 subdomain must consist of lower case alphanumeric characters, '-' or '.', and must start and end with an alphanumeric character (e.g. 'example.com', regex used for validation is '[a-z0-9]([-a-z0-9]*[a-z0-9])?(\.[a-z0-9]([-a-z0-9]*[a-z0-9])?)*')
問題原因:
這是因為主機名不能帶下划線,只能帶中划線。
問題解決:
將主機名的 下划線`_` 改為 中划線`-` 即可
問題八:
問題描述:
修改linux的內核參數時,保存/etc/sysctl.d/kubernetes.conf
文件時,出現Can't open file for writing
錯誤
問題原因:
可能一個原因是權限不夠,使用root解決
問題解決:
$ su root
$ vi /etc/sysctl.d/kubernetes.conf
問題九:
問題描述:
通過yum -y install chrony
后,使用systemctl start chronyd
時出現Job for chronyd.service failed because the control process exited with error code. See "systemctl status chronyd.service" and "journalctl -xe" for details.
問題原因:
使用 yum -y install chrony命令,自動安裝了最新版的chrony服務(配套7.7內核)。由於我的系統是7.3,可能不兼容高版本的chrony服務,導致服務啟動失敗。(個人理解猜測)
問題解決:
- 使用yum -y update。將系統版本升級至最新即可解決。(我使用的此方法)
- 使用CentOS 7.3 yum源,安裝兼容7.3的Chrony版本。
問題十:
問題描述:
使用wget下載東西時,出現-bash: wget: command not found
錯誤
問題原因:
wget沒有安裝
問題解決:
通過yum安裝wget
$ yum install -y wget