1、執行kubectl create -f prometheus-rbac.yaml報錯:
"prometheus-rbac.yaml": error validating data: apiVersion not set
原因:報錯說了“apiVersion not set”,apiVersion沒有設置,檢查一下apiVersion在配置文件中有寫嗎,寫對了嗎,是不是少了個字母之類的。
2、報錯:mount: wrong fs type, bad option, bad superblock on 192.168.1.111:/data/prometheus,
原因:nfs掛載問題,一般是有客戶端沒有安裝nfs-utils,執行yum install nfs-utils安裝就行了
3、kubectl logs -f prometheus-7cc859bccd-m5fvj -n kube-ops查看日志是報錯:
error: a container name must be specified for pod prometheus-7cc859bccd-m5fvj, choose one of: [alertmanager prometheus-server]
原因:因為pod中不止一個容器,所以我們在看pod日志的時候,要加上容器名稱:kubectl logs -f prometheus-7cc859bccd-m5fvj -n kube-ops -c alertmanager
4、啟動alertmanager 容器報錯,日志如下:
level=error ts=2020-05-19T03:19:58.540994885Z caller=main.go:179 msg="Unable to create data directory" err="mkdir data/: read-only file system"
原因:新版本dockerfile中的默認WORKDIR發生了變化,變成了/etc/alertmanager目錄,默認情況下存儲路徑--storage.path是相對目錄data/,因此,alertmanager 會在我們上面掛載的 ConfigMap 中去創建這個目錄,所以會報錯,我們可以通過覆蓋--storage.path參數來解決這個問題
5、啟動grafana報錯:
running "VolumeBinding" filter plugin for pod "grafana-67c548f686-tc94b": pod has unbound immediate PersistentVolumeClaims
原因:沒有可以綁定的pvc,查看一下提前做好pv和pvc沒有,這兩個需要在啟動grafana之前准備好,檢查一下磁盤大小是否符合要求。