etcd安裝和所遇到的坑

本文轉載自查看原文 2018-04-19 10:31 45175

首先參照 https://www.cnblogs.com/lyzw/p/6016789.html來安裝

　　虛擬機：VMware® Workstation 12 Pro

　　系統：CentOS Linux release 7.2.1511 (Core) 3.10.0-327.el7.x86_64

由於剛開始學習k8s，本次軟件的安裝，我們都采用最簡單的方式，能用yum 安裝的盡量采用yum安裝

1、ETCD安裝

ETCD官方文檔：https://github.com/coreos/etcd/blob/master/Documentation/docs.md

1.1 檢查ETCD版本

[root@localhost ~]# yum list|grep etcd
etcd.x86_64                                2.3.7-4.el7                 @extras  
[root@localhost ~]#

1.2 安裝ETCD

yum install etcd

1.3 修改ETCD配置

安裝好后，系統會自動生成etcd.service文件（路徑為/usr/lib/systemd/system/），修改對應的配置

[Unit]
Description=Etcd Server After=network.target After=network-online.target Wants=network-online.target [Service] Type=notify WorkingDirectory=/var/lib/etcd/ EnvironmentFile=-/etc/etcd/etcd.conf User=etcd # set GOMAXPROCS to number of processors ExecStart=/bin/bash -c "GOMAXPROCS=$(nproc) /usr/bin/etcd \ --name=\"${ETCD_NAME}\" \ --data-dir=\"${ETCD_DATA_DIR}\" \ --listen-peer-urls=\"${ETCD_LISTEN_PEER_URLS}\" \ --advertise-client-urls=\"${ETCD_ADVERTISE_CLIENT_URLS}\" \ --initial-cluster-token=\"${ETCD_INITIAL_CLUSTER_TOKEN}\" \ --initial-cluster=\"${ETCD_INITIAL_CLUSTER}\" \ --initial-cluster-state=\"${ETCD_INITIAL_CLUSTER_STATE}\" \ --listen-client-urls=\"${ETCD_LISTEN_CLIENT_URLS}\"" Restart=on-failure LimitNOFILE=65536 [Install] WantedBy=multi-user.target

並配置其配置文件

ETCD_NAME=zwetcd_2
ETCD_DATA_DIR="/var/lib/etcd/default.etcd"ETCD_LISTEN_PEER_URLS="http://192.168.37.131:2380" ETCD_LISTEN_CLIENT_URLS="http://192.168.37.131:2379,http://127.0.0.1:2379" #[cluster] ETCD_INITIAL_ADVERTISE_PEER_URLS="http://192.168.37.131:2380" # if you use different ETCD_NAME (e.g. test), set ETCD_INITIAL_CLUSTER value for this name, i.e. "test=http://..." ETCD_INITIAL_CLUSTER="zwetcd_2=http://192.168.37.131:2380,zwetcd_1=http://192.168.37.130:2380" ETCD_INITIAL_CLUSTER_STATE="new" ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster" ETCD_ADVERTISE_CLIENT_URLS="http://192.168.37.131:2379"

如果使用firewalld作為防火牆，則需要開放端口：

 
                  firewall-cmd --zone=public --add-port=2379 
                  /tcp 
                  --permanent 
                 
                  firewall-cmd --zone=public --add-port=2380 
                  /tcp 
                  --permanent 
                 
                  firewall-cmd --reload 
                 
                  firewall-cmd --list-all

　　問題：

1、本地連接報錯

[root@localhost system]# etcdctl ls /
Error: client: etcd cluster is unavailable or misconfigured
error #0: dial tcp 127.0.0.1:2379: getsockopt: connection refused
error #1: dial tcp 127.0.0.1:4001: getsockopt: connection refused

如果出現如上的錯誤，是因為ETCD_LISTEN_CLIENT_URLS參數沒有配置http://127.0.0.1:2379而導致的，不過已經配置了具體的IP，還需要配置本地鏈路，這個就有點奇怪了。

2、Docker安裝

2.1、檢查docker版本

yum list |grep docker

 
                  [root@localhost ~] 
                  # yum list|grep docker 
                 
                  docker.x86_64                              1.10.3-46.el7.centos.14     @extras   
                 
                  docker-common.x86_64                       1.10.3-46.el7.centos.14     @extras   
                 
                  docker-selinux.x86_64                      1.10.3-46.el7.centos.14     @extras   
                 
                  cockpit-docker.x86_64                      0.114-2.el7.centos          extras    
                 
                  docker-devel.x86_64                        1.3.2-4.el7.centos          extras    
                 
                  docker-distribution.x86_64                 2.4.1-2.el7                 extras    
                 
                  docker-forward-journald.x86_64             1.10.3-44.el7.centos        extras    
                 
                  docker-latest.x86_64                       1.12.1-2.el7.centos         extras    
                 
                  docker-latest-logrotate.x86_64             1.12.1-2.el7.centos         extras    
                 
                  docker-latest-v1.10-migrator.x86_64        1.12.1-2.el7.centos         extras    
                 
                  docker-logrotate.x86_64                    1.10.3-46.el7.centos.14     extras    
                 
                  docker-lvm-plugin.x86_64                   1.10.3-46.el7.centos.14     extras    
                 
                  docker-novolume-plugin.x86_64              1.10.3-46.el7.centos.14     extras    
                 
                  docker-python.x86_64                       1.4.0-115.el7               extras    
                 
                  docker-registry.noarch                     0.6.8-8.el7                 extras    
                 
                  docker-registry.x86_64                     0.9.1-7.el7                 extras    
                 
                  docker-unit- 
                  test 
                  .x86_64                    1.10.3-46.el7.centos.14     extras    
                 
                  docker-v1.10-migrator.x86_64               1.10.3-46.el7.centos.14     extras    
                 
                  python-docker-py.noarch                    1.7.2-1.el7                 extras    
                 
                  [root@localhost ~] 
                  #

2.2 安裝docker

1 yum install docker -y

2.3 檢查docker安裝信息

[root@localhost ~]# docker version
Client:
 Version:         1.10.3 API version: 1.22 Package version: docker-common-1.10.3-46.el7.centos.14.x86_64 Go version: go1.6.3 Git commit: cb079f6-unsupported Built: Fri Sep 16 13:24:25 2016 OS/Arch: linux/amd64 Cannot connect to the Docker daemon. Is the docker daemon running on this host?

3 flannel

3.1 檢查flannel版本

[root@localhost etcd]# yum list |grep flannel flannel.x86_64 0.5.3-9.el7 @extras

3.2 安裝flannel

yum install flannel

3.3 修改service配置

查看flannel的配置文件（使用yum安裝會自動生成此文件，如果下載的執行文件則需要手動生成，在使用systemctl命令執行service 的時候會用到），可以看到flannel的service配置如下：

[root@localhost etcd]# more /usr/lib/systemd/system/flanneld.service [Unit] Description=Flanneld overlay address etcd agent After=network.target After=network-online.target Wants=network-online.target After=etcd.service Before=docker.service [Service] Type=notify EnvironmentFile=/etc/sysconfig/flanneld EnvironmentFile=-/etc/sysconfig/docker-network ExecStart=/usr/bin/flanneld -etcd-endpoints=${FLANNEL_ETCD} -etcd-prefix=${FLANNEL_ETCD_KEY} $FLANNEL_OPTIONS ExecStartPost=/usr/libexec/flannel/mk-docker-opts.sh -k DOCKER_NETWORK_OPTIONS -d /run/flannel/docker Restart=on-failure [Install] WantedBy=multi-user.target RequiredBy=docker.service

其中所有的參數都配置在/etc/sysconfig/flanneld文件中，修改此文件，初始文件如下：

# Flanneld configuration options  

# etcd url location.  Point this to the server where etcd runs
FLANNEL_ETCD="http://127.0.0.1:2379" # etcd config key. This is the configuration key that flannel queries # For address range assignment FLANNEL_ETCD_KEY="/atomic.io/network" # Any additional options that you want to pass FLANNEL_OPTIONS=""

其中

　　FLANNEL_ETCD：為ETCD的地址，

　　FLANNEL_ETCD_KEY：為在etcd中配置的網絡參數的key　

　　FLANNEL_OPTIONS：為flannel的啟動參數，我在這里加上了監聽的網卡

根據前面步驟中etcd的配置，我們修改配置文件如下：

# Flanneld configuration options  

# etcd url location.  Point this to the server where etcd runs
FLANNEL_ETCD="http://192.168.37.130:2379" # etcd config key. This is the configuration key that flannel queries # For address range assignment FLANNEL_ETCD_KEY="/flannel/network" # Any additional options that you want to pass FLANNEL_OPTIONS="--iface=eno16777736"

3.4 啟動FLANNEL

可以使用service flanneld start 或者systemctl start flannel啟動flannel

3.5 修改docker網絡

因為docker需要使用flanneld的網絡，因此需要修改docker的service文件：

[Unit]
Description=Docker Application Container Engine Documentation=http://docs.docker.com After=network.target rhel-push-plugin.socket Wants=docker-storage-setup.service [Service] Type=notify NotifyAccess=all #import flannel configuration EnvironmentFile=-/etc/sysconfig/flanneld EnvironmentFile=-/run/flannel/subnet.env EnvironmentFile=-/etc/sysconfig/docker EnvironmentFile=-/etc/sysconfig/docker-storage EnvironmentFile=-/etc/sysconfig/docker-network Environment=GOTRACEBACK=crash ExecStart=/usr/bin/docker-current daemon \ --exec-opt native.cgroupdriver=systemd \ $OPTIONS \ $DOCKER_STORAGE_OPTIONS \ $DOCKER_NETWORK_OPTIONS \ $ADD_REGISTRY \ $BLOCK_REGISTRY \ $INSECURE_REGISTRY \ --bip=${FLANNEL_SUBNET} LimitNOFILE=1048576 LimitNPROC=1048576 LimitCORE=infinity TimeoutStartSec=0 MountFlags=slave Restart=on-abnormal [Install] WantedBy=multi-user.target

在執行前增加配置文件

EnvironmentFile=-/etc/sysconfig/flanneld

EnvironmentFile=-/run/flannel/subnet.env

執行命令增加參數 --bip=${FLANNEL_SUBNET}

重啟docker

systemctl daemon-reload
systemctl restart docker

3.6 問題

1、Failed to retrieve network config: 104: Not a directory (/flannel/network/config)

問題原因：在初次配置的時候，把flannel的配置文件中的etcd-prefix-key配置成了/flannel/network/config，實際上應該是/flannel/network

注意：如上配置需要在集群的所有機器上執行，完成后，上述安裝的各個系統的啟動順序應該是：

systemctl start etcd

systemctl start flannel

systemctl start docker

配置完檢查：

使用ip a檢查當前的網絡的准備情況：

[root@localhost system]# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8 scope host lo valid_lft forever preferred_lft forever inet6 ::1/128 scope host valid_lft forever preferred_lft forever 2: eno16777736: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000 link/ether 00:0c:29:79:cf:e3 brd ff:ff:ff:ff:ff:ff inet 192.168.37.130/24 brd 192.168.37.255 scope global dynamic eno16777736 valid_lft 1554sec preferred_lft 1554sec inet6 fe80::20c:29ff:fe79:cfe3/64 scope link valid_lft forever preferred_lft forever 9: flannel0: <POINTOPOINT,MULTICAST,NOARP,UP,LOWER_UP> mtu 1472 qdisc pfifo_fast state UNKNOWN qlen 500 link/none inet 172.17.75.0/16 scope global flannel0 valid_lft forever preferred_lft forever 10: docker0: <NO-CARRIER,BROADCAST,MULTICAST,UP> mtu 1500 qdisc noqueue state DOWN link/ether 02:42:e3:f0:0d:05 brd ff:ff:ff:ff:ff:ff inet 172.17.75.1/24 scope global docker0 valid_lft forever preferred_lft forever

如果看到到flannel0余docker0的網段相同，則網絡配置成功。

在第一次安裝完3台機器集群后沒有問題，后面過段時間后要加入一個新節點，就碰到很多坑了

如http://www.mamicode.com/info-detail-2194387.html 此文說到的

        systemd啟動etcd服務的時候出現錯誤：Failed at step CHDIR spawning /usr/bin/etcd: No such file or directory

　　　　　　解決辦法：etcd.service服務配置文件中設置的工作目錄WorkingDirectory=/var/lib/etcd/必須存在，否則會報以上錯誤

        systemd啟動etcd服務的時候出現錯誤：cannot assign requested address

　　　　　　解決辦法：綁定阿里雲的私網IP

也有https://blog.csdn.net/u010087956/article/details/53670468

通過systemd托管的etcd數據備份還原無法啟動服務並且報錯

error listing data dir: /var/lib/etcd/default.etcd

    1

但是單獨執行啟動命令可以

/usr/bin/etcd --debug  --name=default --data-dir=/var/lib/etcd/default.etcd --listen-client-urls http://0.0.0.0:2379 --advertise-client-urls http://0.0.0.0:2380

    1

主要是還原目錄時沒有注意權限問題,systemd默認是以etcd用戶執行的,這里需要修改default.etcd文件夾權限

chown etcd:etcd -R /var/lib/etcd/default.etcd

    1

參考文檔

etcd can’t start due to status=1/FAILURE or status=200/CHDIR · Issue #3331 · coreos/etcd · GitHub

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 etcd集群部署與遇到的坑 etcd集群部署與遇到的坑(轉) 安裝pyspider遇到的坑安裝Sass遇到的坑 Dlib安裝遇到的坑 CocoaPods安裝遇到的坑。安裝 nvm 遇到的坑安裝superset遇到的坑安裝CentOS 7 遇到的坑 macaca 安裝遇到的各種坑