1 介紹
1.1 概念
存活探針(liveness probe):檢查容器是否還在運行,可以為pod中的每個容器單獨指定存活探針。如果探測失敗了,K8S將定期執行探針並重新啟動容器。
1.2 3種探測容器的機制:
1)HTTP GET探針對容器的IP地址(指定端口和路徑)執行HTTP GET請求;探測器收到響應(2xx或3xx),則探測成功。
2)TCP套件字探針嘗試與容器指定端口建立TCP連接;連接建立成功,則探測成功。
3)Exec探針在容器內執行任意命令,並檢查命令的退出狀態碼。狀態碼為0,探測成功,否則,失敗。
1.3 使用方式
1.3.1 通過kubectl get得到重啟次數
$ kubectl get po pod_name
from K8s in Action
上圖中的RESTARTS可以看到pod的容器被重啟了一次;
1.3.2 獲取崩潰容器的應用日志
$ kubectl logs pod_name --previous
通過--previous
選項查看前一個容器的日志。
1.3.3 查看pod描述信息
$ kubectl describe po pod_name
其中退出代碼:137(128+9 SIGKILL)表示進程被外部信號終止,退出代碼143(128+15 SIGTERM)
livenessProbe:
httpGet:
path: /
port: 8080
initialDelaySeconds: 15
k8s會在第一次探測前等待15s,這個初始延遲說明應用程序的啟動時間。
2 探針的創建
生產中運行的pod,需要定義一個存活探針,如果沒有探針,k8s無法知曉應用的存活狀態。
2.1 存活探針檢查
探針配置為請求特定的URL路徑(/health),並讓應用從內部對內部運行的所有重要組件執行狀態檢查,以確保沒有終止或停止響應。需要確保/health HTTP端點不需要認證,否則探測會一直失敗,導致容器無限重啟。
2.2 輕量級
存活探針需要是輕量級的,不可以占用太多的計算資源,時長花費也需要控制。一般是在1s內執行完畢,這樣可以減少主應用程序進程可用的CPU時間。重試循環無需在探針中實現,即使探針的失敗閾值設置為1,k8s為了確認一次探測的失敗,也會多次嘗試。