在LINUX的時鍾中斷中涉及至二個全局變量一個是xtime,它是timeval數據結構變量,另一個則是jiffies,首先看timeval結構
struct timeval
{
time_t tv_sec; /***second***/
susecond_t tv_usec;/***microsecond***/
}
到底microsecond是毫秒還是微秒??
1秒=1000毫秒(3個零),1秒=1000 000微秒(6個零),1秒=1000 000 000納秒(9個零),1秒=1000 000 000 000皮秒(12個零)。
秒用s表現,毫秒用ms,微秒用us表示,納秒用ns表示,皮秒用ps表示,他們的分級單位是千,即每次3個零。
混淆的原因找到了,由於毫秒用ms表示,所以我老是以為microsecond是毫秒,所以就把tv_usec理解錯了。
microsecond查詞霸也是微秒的意思(microsecond!=ms,microsecond==us),看來單位的表示迷惑了我,也迷惑了大多數人,請朋友們牢記這里,非常重要。
xtime是從cmos電路中取得的時間,一般是從某一歷史時刻開始到現在的時間,也就是為了取得我們操作系統上顯示的日期。這個就是所謂的“實時時鍾”,它的精確度是微秒。
jiffies是記錄着從電腦開機到現在總共的時鍾中斷次數。在linux內核中jiffies遠比xtime重要,那么他取決於系統的頻率,單位是Hz,這里不得不說一下頻率的單位,1MHz=1000,000Hz(6個零),1KHz=1000Hz(3個零).
頻率是周期的倒數,一般是一秒鍾中斷產生的次數,所以,假如我們需要知道系統的精確的時間單位時,需要換算了,假如我們系統的頻率是200Mhz,那么一次中斷的間隔是1秒/200,000,000Hz=0.000 000 005秒看一下上面我們的時間單位,對照一下小數點后面是9個零,所以理論上我們系統的精確度是5納秒。LINUX系統時鍾頻率是一個常數HZ來決定的,通常HZ=100,那么他的精度度就是10ms(毫秒)。也就是說每10ms一次中斷。所以一般來說Linux的精確度是10毫秒。
硬件給內核提供一個系統定時器用以計算和管理時間,內核通過編程預設系統定時器的頻率,即節拍率(tick rate),每一個周期稱作一個tick(節拍)。Linux內核從2.5版內核開始把頻率從100調高到1000,時間單位 jiffies 有多長?
"在 Linux 2.6 中,系統時鍾每 1 毫秒中斷一次(時鍾頻率,用 HZ 宏表示,定義為 1000,即每秒中斷 1000 次,2.4 中定義為 100,很多應用程序也仍然沿用 100 的時鍾頻率),這個時間單位稱為一個 jiffie。"
"jiffies 與絕對時間之間的轉換, 用兩個宏來完成兩種時間單位的互換:JIFFIES_TO_NS()、NS_TO_JIFFIES()"
(當然帶來了很多優點,也有一些缺點).
硬件給內核提供一個系統定時器用以計算和管理時間,內核通過編程預設系統定時器的頻率,即節拍率(tick rate),每一個周期稱作一個tick(節拍)。Linux內核從2.5版內核開始把頻率從100調高到1000(當然帶來了很多優點,也有一些缺點).
jiffies是內核中的一個全局變量,用來記錄自系統啟動一來產生的節拍數。譬如,如果計算系統運行了多長時間,可以用 jiffies/tick rate 來計算。jiffies定義在文件<linux/jiffies.h>中:
extern unsigned long volatile jiffies;
可以利用jiffies設置超時等,譬如:
unsigned long timeout = jiffies + tick_rate * 2; // 2秒鍾后超時
if(time_before(jiffies, timeout){
// 還沒有超時
}
else{
// 已經超時
}
內核提供了四個宏來比較節拍計數,這些宏定義在文件<linux/jiffies.h>中:
time_before(unknown, known)
time_after(unknown, known)
time_before_eq(unknown, known)
time_after_eq(unknown, known)
比較的時候用這些宏可以避免jiffies由於過大造成的回繞問題。
除了系統定時器外,還有一個與時間有關的時鍾:實時時鍾(RTC),這是一個硬件時鍾,用來持久存放系統時間,系統關閉后靠主板上的微型電池保持計時。系統啟動時,內核通過讀取RTC來初始化Wall Time,並存放在xtime變量中,這是RTC最主要的作用。
///////////////////////////////////////////////////////////////////網絡相關函數內容詳解//////////////////////////////////////////////////////////////////////
Linux核心幾個重要跟時間有關的名詞或變數,以下將介紹HZ、tick與jiffies。
HZ
Linux核心每隔固定周期會發出timer interrupt (IRQ 0),HZ是用來定義每一秒有幾次timer interrupts。舉例來說,HZ為1000,代表每秒有1000次timer interrupts。 HZ可在編譯核心時設定,如下所示(以核心版本2.6.20-15為例):
adrian@adrian-desktop:~$ cd /usr/src/linux
adrian@adrian-desktop:/usr/src/linux$ make menuconfig
Processor type and features ---> Timer frequency (250 HZ) --->
其中HZ可設定100、250、300或1000。
小實驗
觀察/proc/interrupt的timer中斷次數,並於一秒后再次觀察其值。理論上,兩者應該相差250左右。
adrian@adrian-desktop:~$ cat /proc/interrupts | grep timer && sleep 1 && cat /proc/interrupts | grep timer
0: 9309306 IO-APIC-edge timer
0: 9309562 IO-APIC-edge timer
上面四個欄位分別為中斷號碼、CPU中斷次數、PIC與裝置名稱。
要檢查系統上HZ的值是什么,就執行命令
cat kernel/.config | grep '^CONFIG_HZ='
Tick是HZ的倒數,意即timer interrupt每發生一次中斷的時間。如HZ為250時,tick為4毫秒(millisecond)。
Jiffies為Linux核心變數(unsigned long),它被用來記錄系統自開機以來,已經過了多少tick。每發生一次timer interrupt,Jiffies變數會被加一。值得注意的是,Jiffies於系統開機時,並非初始化成零,而是被設為-300*HZ (arch/i386/kernel/time.c),即代表系統於開機五分鍾后,jiffies便會溢位。那溢位怎么辦?事實上,Linux核心定義幾個macro(timer_after、time_after_eq、time_before與time_before_eq),即便是溢位,也能借由這幾個macro正確地取得jiffies的內容。
另外,80x86架構定義一個與jiffies相關的變數jiffies_64 ,此變數64位元,要等到此變數溢位可能要好幾百萬年。因此要等到溢位這刻發生應該很難吧。
全局變量jiffies取值為自操作系統啟動以來的時鍾滴答的數目,在頭文件<linux/sched.h>中定義,數據類型為unsigned long volatile (32位無符號長整型)。
jiffies轉換為秒可采用公式:(jiffies/HZ)計算,
將秒轉換為jiffies可采用公式:(seconds*HZ)計算。
當時鍾中斷發生時,jiffies 值就加1。因此連續累加一年又四個多月后就會溢出(假定HZ=100,1個jiffies等於1/100秒,jiffies可記錄的最大秒數為 (2^32 -1)/100=42949672.95秒,約合497天或1.38年),即當取值到達最大值時繼續加1,就變為了0。
Linux內核中提供了以下四個宏,可有效解決由於jiffies溢出而造成程序邏輯出錯的情況。下面是從Linux Kernel 2.6.7版本中摘取出來的代碼:
/*
* These inlines deal with timer wrapping correctly. You are
* strongly encouraged to use them
* 1. Because people otherwise forget
* 2. Because if the timer wrap changes in future you won't have to
* alter your driver code.
*
* time_after(a,b) returns true if the time a is after time b.
*
* Do this with "<0" and ">=0" to only test the sign of the result. A
* good compiler would generate better code (and a really good compiler
* wouldn't care). Gcc is currently neither.
*/
#define time_after(a,b) \
(typecheck(unsigned long, a) && \
typecheck(unsigned long, b) && \
((long)(b) - (long)(a) < 0))
#define time_before(a,b) time_after(b,a)
#define time_after_eq(a,b) \
(typecheck(unsigned long, a) && \
typecheck(unsigned long, b) && \
((long)(a) - (long)(b) >= 0))
#define time_before_eq(a,b) time_after_eq(b,a)
在宏time_after中,首先確保兩個輸入參數a和b的數據類型為unsigned long,然后才執行實際的比較。
8. 結論
系統中采用jiffies來計算時間,但由於jiffies溢出可能造成時間比較的錯誤,因而強烈建議在編碼中使用 time_after等宏來比較時間先后關系,這些宏可以放心使用。
內核時鍾:
內核使用硬件提供的不同時鍾來提供依賴於時間的服務,如busy-waiting(浪費CPU周期)和sleep-waiting(放棄CPU)
jiffies記錄了系統啟動后的滴答數,常用的函數:time_before()、 time_after()、time_after_eq()、time_before_eq()。因為jiffies隨時鍾滴答變化,不能用編譯器優化它,應取volatile值。
32位jiffies變量會在50天后溢出,太小,因此內核提供變量jiffies_64來hold 64位jiffies。該64位的低32位即為jiffies,在32位機上需要兩天指令來賦值64位數據,不是原子的,因此內核提供函數 get_jiffies_64()。
busy-wait:timebefore(),使CPU忙等待;sleep-wait:shedule_timeout(截至時間);無論在內核空間還是用戶空間,都沒有比HZ更精確的控制了,因為時間片都是根據滴答更新的,而且即使定義了您的進程在超過指定時間后運行,調度器也可能根據優先級選擇其他進程執行。
sleep-wait():wait_event_timeout()用於在滿足某個條件或超時后重新執行,msleep()睡眠指定的ms后重新進入就緒隊列,這些長延遲僅適用於進程上下文,在中斷上下文中不能睡眠也不能長時間busy-waiting。
內核提供了timer API來在一定時間后執行某個函數:
#include <linux/timer.h>
struct timer_list my_timer;
init_timer(&my_timer); /* Also see setup_timer() */
my_timer.expire = jiffies + n*HZ; /* n is the timeout in number of seconds */
my_timer.function = timer_func; /* Function to execute
after n seconds */
my_timer.data = func_parameter; /* Parameter to be passed to timer_func */
add_timer(&my_timer); /*Start the timer*/
如果您想周期性執行上述代碼,那么把它們加入timer_func()函數。您使用mod_timer()來改變my_timer的超時值,del_timer()來刪掉my_timer,用timer_pending()查看是否my_timer處於掛起狀態。
用戶空間函數clock_settime()和clock_gettime()用於獲取內核時鍾服務。用戶應用程序使用setitimer()和getitimer()來控制alarm信號的傳遞當指定超時發生后。
RTC時鍾track絕對時間。RTC電池常超過computer生存期。可以用RTC完成以下功能:(1)讀或設置絕對時鍾,並在clock updates時產生中斷;(2)以2HZ到8192HZ來產生周期性中斷;(3)設置alarms。
jiffies僅是相對於系統啟動的相對時間,如果想獲取absolute time或wall time,則需要使用RTC,內核用變量xtime來記錄,當系統啟動時,讀取RTC並記錄在xtime中,當系統halt時,則將wall time寫回RTC,函數do_gettimeofday()來讀取wall time。
#include <linux/time.h>
static struct timeval curr_time;
do_gettimeofday(&curr_time);
my_timestamp = cpu_to_le32(curr_time.tv_sec); /* Record timestamp */
用戶空間獲取wall time的函數:time()返回calendar time或從00:00:00 on January 1,1970的秒數;(2)localtime():返回calendar time in broken-down format;(3)mktime():與 localtime()相反;(4)gettimeofday()以microsecond 精確度返回calendar時間。
另外一個獲取RTC的方法是通過字符設備/dev/rtc,一個時刻僅允許一個處理器訪問它。
時鍾和定時器對Linux內核來說十分重要。首先,內核要管理系統的運行時間(uptime)和當前牆上時間(wall time), 即當前實際時間。其次,內核中大量的活動由時間驅動。
內核必須借助硬件來實現時間管理。實時時鍾是用來持久存放系統時間的設備,它通過主板電池供電,所以即便在關閉計算機系統之后,實時時鍾仍然能繼續工作。
系統啟動時,內核讀取實時時鍾,將所讀的時間存放在變量xtime中作為牆上時間(wall time),xtime保存着從1970年1月1日0:00到當前時刻所經歷的秒數。雖然在Intel x86機器上,內核會周期性地將當前時間存回實時時鍾中,但應該明確,實時時鍾的主要作用就是在啟動時初始化牆上時間xtime。
周期性發生的事件都是由系統定時器驅動。在X86體系結構上,系統定時器通常是一種可編程硬件芯片,其產生的中斷就是時鍾中斷。時鍾中斷對應的處理程序負責更新系統時間和執行周期性運行的任務。系統定時器的頻率稱為節拍率(tick rate),在內核中表示為HZ。
以X86為例,在2.4之前的內核中其大小為100; 從內核2.6開始,HZ = 1000, 也就是說每秒時鍾中斷發生1000次。這一變化使得系統定時器的精度(resolution)由10ms提高到1ms,這大大提高了系統對於時間驅動事件調度的精確性。過於頻繁的時鍾中斷不可避免地增加了系統開銷。
與系統定時器相對的是動態定時器,它是調度事件(執行調度程序)在未來某個時刻發生的時機。內核可以動態地創建或銷毀動態定時器。
系統定時器及其中斷處理程序是內核管理機制的中樞,下面是一些利用系統定時器周期執行的工作(中斷處理程序所做的工作):
(1) 更新系統運行時間(uptime)
(2) 更新當前牆上時間(wall time)
(3) 在對稱多處理器系統(SMP)上,均衡調度各處理器上的運行隊列
(4) 檢查當前進程是否用完了時間片(time slice),如果用盡,則進行重新調度
(5) 運行超時的動態定時器
(6) 更新資源耗盡和處理器時間的統計值
內核動態定時器依賴於系統時鍾中斷,因為只有在系統時鍾中斷發生后內核才會去檢查當前是否有超時的動態定時器。
---------------------------------------------------------
X86體系結構中,內核2.6.X的HZ = 1000, 即系統時鍾中斷執行粒度為1ms,這意味着系統中周期事情最快為1ms執行一次,而不可能有更高的精度。動態定時器隨時都可能超時,但由於只有在系統時鍾中斷到來時內核才會檢查執行超時的動態定時器,所以動態定時器的平均誤差大約為半個系統時鍾周期(即0.5ms).