如何查看進程發生缺頁中斷的次數?
用ps -o majflt,minflt -C program命令查看。
majflt代表major fault,中文名叫大錯誤,minflt代表minor fault,中文名叫小錯誤。
這兩個數值表示一個進程自啟動以來所發生的缺頁中斷的次數。
發成缺頁中斷后,執行了那些操作?
當一個進程發生缺頁中斷的時候,進程會陷入內核態,執行以下操作:
1、檢查要訪問的虛擬地址是否合法
2、查找/分配一個物理頁
3、填充物理頁內容(讀取磁盤,或者直接置0,或者啥也不干)
4、建立映射關系(虛擬地址到物理地址)
重新執行發生缺頁中斷的那條指令
如果第3步,需要讀取磁盤,那么這次缺頁中斷就是majflt,否則就是minflt。
內存分配的原理
從操作系統角度來看,進程分配內存有兩種方式,分別由兩個系統調用完成:brk和mmap(不考慮共享內存)。
1、brk是將數據段(.data)的最高地址指針_edata往高地址推;
2、mmap是在進程的虛擬地址空間中(堆和棧中間,稱為文件映射區域的地方)找一塊空閑的虛擬內存。
這兩種方式分配的都是虛擬內存,沒有分配物理內存。在第一次訪問已分配的虛擬地址空間的時候,發生缺頁中斷,操作系統負責分配物理內存,然后建立虛擬內存和物理內存之間的映射關系。
在標准C庫中,提供了malloc/free函數分配釋放內存,這兩個函數底層是由brk,mmap,munmap這些系統調用實現的。
下面以一個例子來說明內存分配的原理:
情況一、malloc小於128k的內存,使用brk分配內存,將_edata往高地址推(只分配虛擬空間,不對應物理內存(因此沒有初始化),第一次讀/寫數據時,引起內核缺頁中斷,內核才分配對應的物理內存,然后虛擬地址空間建立映射關系),如下圖:
2、進程調用A=malloc(30K)以后,內存空間如圖2:
3、進程調用B=malloc(40K)以后,內存空間如圖3。
情況二、malloc大於128k的內存,使用mmap分配內存,在堆和棧之間找一塊空閑內存分配(對應獨立內存,而且初始化為0),如下圖:
5、進程調用D=malloc(100K)以后,內存空間如圖5;
6、進程調用free(C)以后,C對應的虛擬內存和物理內存一起釋放。
8、進程調用free(D)以后,如圖8所示:
在了解了內存分配原理以后來看一個現象:
現象
1 壓力測試過程中,發現被測對象性能不夠理想,具體表現為:
進程的系統態CPU消耗20,用戶態CPU消耗10,系統idle大約70
2 用ps -o majflt,minflt -C program命令查看,發現majflt每秒增量為0,而minflt每秒增量大於10000。
初步分析
majflt代表major fault,中文名叫大錯誤,minflt代表minor fault,中文名叫小錯誤。
這兩個數值表示一個進程自啟動以來所發生的缺頁中斷的次數。
當一個進程發生缺頁中斷的時候,進程會陷入內核態,執行以下操作:
檢查要訪問的虛擬地址是否合法
查找/分配一個物理頁
填充物理頁內容(讀取磁盤,或者直接置0,或者啥也不干)
建立映射關系(虛擬地址到物理地址)
重新執行發生缺頁中斷的那條指令
如果第3步,需要讀取磁盤,那么這次缺頁中斷就是majflt,否則就是minflt。
此進程minflt如此之高,一秒10000多次,不得不懷疑它跟進程內核態cpu消耗大有很大關系。
分析代碼
查看代碼,發現是這么寫的:一個請求來,用malloc分配2M內存,請求結束后free這塊內存。看日志,發現分配內存語句耗時10us,平均一條請求處理耗時1000us 。 原因已找到!
雖然分配內存語句的耗時在一條處理請求中耗時比重不大,但是這條語句嚴重影響了性能。要解釋清楚原因,需要先了解一下內存分配的原理。
真相大白
說完內存分配的原理,那么被測模塊在內核態cpu消耗高的原因就很清楚了:每次請求來都malloc一塊2M的內存,默認情況下,malloc調用mmap分配內存,請求結束的時候,調用munmap釋放內存。假設每個請求需要6個物理頁,那么每個請求就會產生6個缺頁中斷,在2000的壓力下,每秒就產生了10000多次缺頁中斷,這些缺頁中斷不需要讀取磁盤解決,所以叫做minflt;缺頁中斷在內核態執行,因此進程的內核態cpu消耗很大。缺頁中斷分散在整個請求的處理過程中,所以表現為分配語句耗時(10us)相對於整條請求的處理時間(1000us)比重很小。
解決辦法
將動態內存改為靜態分配,或者啟動的時候,用malloc為每個線程分配,然后保存在threaddata里面。但是,由於這個模塊的特殊性,靜態分配,或者啟動時候分配都不可行。另外,Linux下默認棧的大小限制是10M,如果在棧上分配幾M的內存,有風險。
禁止malloc調用mmap分配內存,禁止內存緊縮。
在進程啟動時候,加入以下兩行代碼:
mallopt(M_MMAP_MAX, 0); // 禁止malloc調用mmap分配內存
mallopt(M_TRIM_THRESHOLD, -1); // 禁止內存緊縮
效果:加入這兩行代碼以后,用ps命令觀察,壓力穩定以后,majlt和minflt都為0。進程的系統態cpu從20降到10。
小結
可以用命令ps -o majflt minflt -C program來查看進程的majflt, minflt的值,這兩個值都是累加值,從進程啟動開始累加。在對高性能要求的程序做壓力測試的時候,我們可以多關注一下這兩個值。
如果一個進程使用了mmap將很大的數據文件映射到進程的虛擬地址空間,我們需要重點關注majflt的值,因為相比minflt,majflt對於性能的損害是致命的,隨機讀一次磁盤的耗時數量級在幾個毫秒,而minflt只有在大量的時候才會對性能產生影響。