Linux 自帶了一個 watchdog 的實現,用於監視系統的運行,包括一個內核 watchdog module 和一個用戶空間的 watchdog 程序。內核 watchdog 模塊通過 /dev/watchdog 這個字符設備與用戶空間通信。用戶空間程序一旦打開 /dev/watchdog 設備(俗稱“開門放狗”),就會導致在內核中啟動一個1分鍾的定時器(系統默認時間),此后,用戶空間程序需要保證在1分鍾之內向這個設備寫入數據(俗稱“定期喂狗”),每次寫操作會導致重新設定定時器。如果用戶空間程序在1分鍾之內沒有寫操作,定時器到期會導致一次系統 reboot 操作(“狗咬人了”呵呵)。通過這種機制,我們可以保證系統核心進程大部分時間都處於運行狀態,即使特定情形下進程崩潰,因無法正常定時“喂狗”,linux系統在看門狗作用下重新啟動(reboot),核心進程又運行起來了。多用於嵌入式系統。
打開 /dev/watchdog 設備(“開門放狗”):
- int fd_watchdog = open("/dev/watchdog", O_WRONLY);
- if(fd_watchdog == -1) {
- int err = errno;
- printf("\n!!! FAILED to open /dev/watchdog, errno: %d, %s\n", err, strerror(err));
- syslog(LOG_WARNING, "FAILED to open /dev/watchdog, errno: %d, %s", err, strerror(err));
- }
每隔一段時間向 /dev/watchdog 設備寫入數據(“定期喂狗”):
- //feed the watchdog
- if(fd_watchdog >= 0) {
- static unsigned char food = 0;
- ssize_t eaten = write(fd_watchdog, &food, 1);
- if(eaten != 1) {
- puts("\n!!! FAILED feeding watchdog");
- syslog(LOG_WARNING, "FAILED feeding watchdog");
- }
- }
關閉 /dev/watchdog 設備,通常不需要這個步驟:
- close(fd_watchdog);
所需頭文件:
- #include <unistd.h>
- #include <sys/stat.h>
- #include <syslog.h>
- #include <errno.h>