Linux 軟件看門狗 watchdog


Linux 自帶了一個 watchdog 的實現,用於監視系統的運行,包括一個內核 watchdog module 和一個用戶空間的 watchdog 程序。內核 watchdog 模塊通過 /dev/watchdog 這個字符設備與用戶空間通信。用戶空間程序一旦打開 /dev/watchdog 設備(俗稱“開門放狗”),就會導致在內核中啟動一個1分鍾的定時器(系統默認時間),此后,用戶空間程序需要保證在1分鍾之內向這個設備寫入數據(俗稱“定期喂狗”),每次寫操作會導致重新設定定時器。如果用戶空間程序在1分鍾之內沒有寫操作,定時器到期會導致一次系統 reboot 操作(“狗咬人了”呵呵)。通過這種機制,我們可以保證系統核心進程大部分時間都處於運行狀態,即使特定情形下進程崩潰,因無法正常定時“喂狗”,linux系統在看門狗作用下重新啟動(reboot),核心進程又運行起來了。多用於嵌入式系統。

 

打開 /dev/watchdog 設備(“開門放狗”):

 

[cpp]   view plain   copy
 
 
 
  1. int fd_watchdog = open("/dev/watchdog", O_WRONLY);  
  2. if(fd_watchdog == -1) {  
  3.     int err = errno;  
  4.     printf("\n!!! FAILED to open /dev/watchdog, errno: %d, %s\n", err, strerror(err));  
  5.     syslog(LOG_WARNING, "FAILED to open /dev/watchdog, errno: %d, %s", err, strerror(err));  
  6. }  


每隔一段時間向 /dev/watchdog 設備寫入數據(“定期喂狗”):

 

 

[cpp]   view plain   copy
 
 
 
  1. //feed the watchdog  
  2. if(fd_watchdog >= 0) {  
  3.     static unsigned char food = 0;  
  4.     ssize_t eaten = write(fd_watchdog, &food, 1);  
  5.     if(eaten != 1) {  
  6.         puts("\n!!! FAILED feeding watchdog");  
  7.         syslog(LOG_WARNING, "FAILED feeding watchdog");  
  8.     }  
  9. }  


關閉 /dev/watchdog 設備,通常不需要這個步驟:

 

 

[cpp]   view plain   copy
 
 
 
  1. close(fd_watchdog);  

 

所需頭文件:

 

[cpp]   view plain   copy
 
 
 
    1. #include <unistd.h>  
    2. #include <sys/stat.h>  
    3. #include <syslog.h>  
    4. #include <errno.h>  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM