轉載:https://blog.csdn.net/xiaodanpeng/article/details/53503076
在Linux下,CPU利用率分為用戶態,系統態和空閑態,分別表示CPU處於用戶態執行的時間,系統內核執行的時間,和空閑系統進程執行的時間,三者之和就是CPU的總時間,當沒有用戶進程、系統進程等需要執行的時候,CPU就執行系統缺省的空閑進程。從平常的思維方式理解的話,CPU的利用率就是非空閑進程占用時間的比例,即CPU執行非空閑進程的時間 / CPU總的執行時間。
在Linux系統中,CPU時間的分配信息保存在/proc/stat文件中,利用率的計算應該從這個文件中獲取數據。文件的頭幾行記錄了每個CPU的用戶態,系統態,空閑態等狀態下分配的時間片(單位是Jiffies),這些數據是從CPU加電到當前的累計值。常用的監控軟件就是利用/proc/stat里面的這些數據來計算CPU的利用率的。
不同版本的linux /proc/stat文件內容不一樣,以Linux 2.6來說,/proc/stat文件的內容如下:
cpu 2032004 102648 238344 167130733 758440 15159 17878 0
cpu0 1022597 63462 141826 83528451 366530 9362 15386 0
cpu1 1009407 39185 96518 83602282 391909 5796 2492 0
intr 303194010 212852371 3 0 0 11 0 0 2 1 1 0 0 3 0 11097365 0 72615114 6628960 0 179 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
ctxt 236095529
btime 1195210746
processes 401389
procs_running 1
procs_blocked 0
第一行的數值表示的是CPU總的使用情況,所以我們只要用第一行的數字計算就可以了。下表解析第一行各數值的含義(單位:jiffies):
user (2032004) |
從系統啟動開始累計到當前時刻,用戶態的CPU時間,不包含nice值為負進程。 |
nice (102648) |
從系統啟動開始累計到當前時刻,nice值為負的進程所占用的CPU時間 |
system (238344) |
從系統啟動開始累計到當前時刻,核心時間 |
idle (167130733) |
從系統啟動開始累計到當前時刻,除IO等待時間以外其它等待時間 |
iowait (758440) |
從系統啟動開始累計到當前時刻,IO等待時間 |
irq (15159) |
從系統啟動開始累計到當前時刻,硬中斷時間 |
softirq (17878) |
從系統啟動開始累計到當前時刻,軟中斷時間 |
因為/proc/stat中的數值都是從系統啟動開始累計到當前時刻的積累值,所以需要在不同時間點t1和t2取值進行比較運算,當兩個時間點的間隔較短時,就可以把這個計算結果看作是CPU的即時利用率。
CPU的即時利用率的計算公式:
CPU在t1到t2時間段總的使用時間 = ( user2+ nice2+ system2+ idle2+ iowait2+ irq2+ softirq2) - ( user1+ nice1+ system1+ idle1+ iowait1+ irq1+ softirq1)
CPU在t1到t2時間段空閑使用時間 = (idle2 - idle1)
CPU在t1到t2時間段即時利用率 = 1 - CPU空閑使用時間 / CPU總的使用時間
這些值是誰,什么時候記錄的呢?
每次timer的中斷就會記錄一次,記錄在struct cpu_usage_stat 里,實現在timer_tick ->update_process_times里。
那么它的精度就是HZ,如果HZ是100,就意味着每S記錄100次。這個精度當然是不高的,而且容易出錯,下面是在Documentation/cpu-load.txt中的一個例子:
time line between two timer interrupts
|--------------------------------------|
^ ^
|_ user appA begins working |
|_ user appA goes to sleep
結果這個A的動作沒有被記錄下來,這一S有可能被記錄到其他的頭上。如果你做的程序正好是那個其他,你就會抱怨說,這真是一陀屎呀。
那么有沒有高精度的記錄呢?
有,但是要自己寫,就算你用oprofile之類的,他的原理也是用timer_interrupt記錄的,你可以用其他的高精度timer,但是,頻繁的中斷會把系統弄死。所以要自己寫,假設有一個高精度的硬件counter,好像x86下的TimeStamp Counter,
在cpu_idle 里記錄idle的時間,在asm_do_IRQ里記錄處理irq的時間,在context_switch記錄進入了那個process,以及時間,在__do_softirq里記錄處理softirq的時間,把這些東西記錄在一塊全局數組里。