dstat,vmstat,dd,iostat,mpstat,sar,free,iopp,iotop,iodump,ethtool,mii-tool;linux性能瓶頸排查；

dstat -cdlmnpsy --tcp 5 --------->每5秒取值( system：int，csw分別為系統的中斷次數（interrupt）和上下文切換（context switch）hiq，siq分別為硬中斷和軟中斷次數)

vmstat 2 8----------------->每2秒取值，取8次，關注項有：r,us,id,io(bi,bo)

iostat -x 1 5 --------------->每1秒取值，取5次，關注項有：await,%util
sar 1 6 --------------------->每1秒取值，取6次，關注項有： %iowait
dd if=/dev/sdc of=test bs=64k count=4k oflag=dsync------------->

記錄了4096+0 的讀入
記錄了4096+0 的寫出
268435456字節(268 MB)已復制，3.77072 秒，71.2 MB/秒

iostat和iowait[轉]

這個文章說明：高速cpu會造成很高的iowait值，但這並不代表磁盤是系統的瓶頸。唯一能說明磁盤是系統瓶頸的方法，就是很高的read/write時間，一般來說超過20ms，就代表了不太正常的磁盤性能。為什么是20ms呢？一般來說，一次讀寫就是一次尋到+一次旋轉延遲+數據傳輸的時間。由於，現代硬盤數據傳輸就是幾微秒或者幾十微秒的事情，遠遠小於尋道時間2~20ms和旋轉延遲4~8ms，所以只計算這兩個時間就差不多了，也就是15~20ms。只要大於20ms，就必須考慮是否交給磁盤讀寫的次數太多，導致磁盤性能降低了。

作者的文章以AIX系統為例，使用其工具filemon來檢測磁盤每次讀寫平均耗時。在Linux下，可以通過iostat命令還查看磁盤性能。其中的svctm一項，反應了磁盤的負載情況，如果該項大於15ms，並且util%接近100%，那就說明，磁盤現在是整個系統性能的瓶頸了。

轉載自：扶凱: http://www.php-oa.com/2009/02/03/iostat.html
以前一直不太會用這個參數。現在認真研究了一下iostat，因為剛好有台重要的服務器壓力高,所以放上來分析一下.下面這台就是IO有壓力過大的服務器

如果 %util 接近 100%，說明產生的I/O請求太多，I/O系統已經滿負荷，該磁盤可能存在瓶頸。

同時可以結合vmstat 查看查看b參數(等待資源的進程數)和wa參數(IO等待所占用的CPU時間的百分比,高過30%時IO壓力高)

另外 await 的參數也要多和 svctm 來參考。差的過高就一定有 IO 的問題。

avgqu-sz 也是個做 IO 調優時需要注意的地方，這個就是直接每次操作的數據的大小，如果次數多，但數據拿的小的話，其實 IO 也會很小.如果數據拿的大，才IO 的數據會高。也可以通過 avgqu-sz × ( r/s or w/s ) = rsec/s or wsec/s.也就是講，讀定速度是這個來決定的。

svctm 一般要小於 await (因為同時等待的請求的等待時間被重復計算了)，svctm 的大小一般和磁盤性能有關，CPU/內存的負荷也會對其有影響，請求過多也會間接導致 svctm 的增加。await 的大小一般取決於服務時間(svctm) 以及 I/O 隊列的長度和 I/O 請求的發出模式。如果 svctm 比較接近 await，說明 I/O 幾乎沒有等待時間；如果 await 遠大於 svctm，說明 I/O 隊列太長，應用得到的響應時間變慢，如果響應時間超過了用戶可以容許的范圍，這時可以考慮更換更快的磁盤，調整內核 elevator 算法，優化應用，或者升級 CPU。

隊列長度(avgqu-sz)也可作為衡量系統 I/O 負荷的指標，但由於 avgqu-sz 是按照單位時間的平均值，所以不能反映瞬間的 I/O 洪水。

舉一個例子，我們在超市排隊 checkout 時，怎么決定該去哪個交款台呢? 首當是看排的隊人數，5個人總比20人要快吧? 除了數人頭，我們也常常看看前面人購買的東西多少，如果前面有個采購了一星期食品的大媽，那么可以考慮換個隊排了。還有就是收銀員的速度了，如果碰上了連錢都點不清楚的新手，那就有的等了。另外，時機也很重要，可能 5 分鍾前還人滿為患的收款台，現在已是人去樓空，這時候交款可是很爽啊，當然，前提是那過去的 5 分鍾里所做的事情比排隊要有意義 (不過我還沒發現什么事情比排隊還無聊的)。

我們可以根據這些數據分析出 I/O 請求的模式，以及 I/O 的速度和響應時間。

上面的 iostat 輸出表明秒有 28.57 次設備 I/O 操作: 總IO(io)/s = r/s(讀) +w/s(寫) = 1.02+27.55 = 28.57 (次/秒) 其中寫操作占了主體 (w:r = 27:1)。

平均每次設備 I/O 操作只需要 5ms 就可以完成，但每個 I/O 請求卻需要等上 78ms，為什么? 因為發出的 I/O 請求太多 (每秒鍾約 29 個)，假設這些請求是同時發出的，那么平均等待時間可以這樣計算:

平均等待時間 = 單個 I/O 服務時間 * ( 1 + 2 + … + 請求總數-1) / 請求總數

應用到上面的例子: 平均等待時間 = 5ms * (1+2+…+28)/29 = 70ms，和 iostat 給出的78ms 的平均等待時間很接近。這反過來表明 I/O 是同時發起的。

每秒發出的 I/O 請求很多 (約 29 個)，平均隊列卻不長 (只有 2 個左右)，這表明這 29 個請求的到來並不均勻，大部分時間 I/O 是空閑的。

一秒中有 14.29% 的時間 I/O 隊列中是有請求的，也就是說，85.71% 的時間里 I/O 系統無事可做，所有 29 個 I/O 請求都在142毫秒之內處理掉了。

delta(ruse+wuse)/delta(io) = await = 78.21 => delta(ruse+wuse)/s =78.21 * delta(io)/s = 78.21*28.57 = 2232.8，表明每秒內的I/O請求總共需要等待2232.8ms。所以平均隊列長度應為 2232.8ms/1000ms = 2.23，而 iostat 給出的平均隊列長度 (avgqu-sz) 卻為 22.35，為什么?! 因為 iostat 中有 bug，avgqu-sz 值應為 2.23，而不是 22.35。

inode是Linux/Unix系文件系統[如ext]中的一個概念，當一個文件系統格式化了以后，他一定會有 inode table 與 data area 兩個區塊。Block 是記錄文件內容數據的地區，而 inode 則是記錄該文件的屬性、及該文件放置在哪一個 Block 之內的信息。而且每個文件至少需要一個inode。

使用df -i可以看到文件系統的inode總數、使用數、剩余量和使用百分比。

inode大小決定了一個文件系統中的inode總量，在創建文件系統的時候可以指定inode的大小，創建之后不可修改：

可能出現磁盤空閑空間充足的情況下，新建文件時提示磁盤空間滿。

一般是小文件過多，如果一個文件大小比文件系統的塊大小還小，如文件系統的block size為4k，而文件只有2k，則有2k的空間被浪費，也就是blocks per inode ratio過小，從而有可能會出現磁盤空間未滿，而inode數消耗殆盡的情況。

1、當 block 越小、inodes 越多，可利用空間越多，但是大文件寫入效率較差：適合文件數量多但是文件容量小的系統，例如 BBS 或者新聞群組 news 這方面的服務之系統；

2、當 block 越大、 inodes 數越少，大文件寫入效率較佳，但浪費的空間較多：適合文件容量大的系統。

IO調度器的總體目標是希望讓磁頭能夠總是往一個方向移動,移動到底了再往反方向走,這恰恰就是現實生活中的電梯模型,所以IO調度器也被叫做電梯.(elevator)而相應的算法也就被叫做電梯算法.而Linux中IO調度的電梯算法有好幾種,一個叫做as(Anticipatory),一個叫做cfq(Complete Fairness Queueing),一個叫做deadline,還有一個叫做noop(No Operation).具體使用哪種算法我們可以在啟動的時候通過內核參數elevator來指定.

另一方面我們也可以單獨的為某個設備指定它所采用的IO調度算法,這就通過修改在/sys/block/sda/queue/目錄下面的scheduler文件.比如我們可以先看一下我的這塊硬盤:

IO調度器（IO Scheduler）是操作系統用來決定塊設備上IO操作提交順序的方法。存在的目的有兩個，一是提高IO吞吐量，二是降低IO響應時間。然而IO吞吐量和IO響應時間往往是矛盾的，為了盡量平衡這兩者，IO調度器提供了多種調度算法來適應不同的IO請求場景。其中，對數據庫這種隨機讀寫的場景最有利的算法是DEANLINE。接着我們按照從簡單到復雜的順序，迅速掃一下Linux 2.6內核提供的幾種IO調度算法。

NOOP算法的全寫為No Operation。該算法實現了最最簡單的FIFO隊列，所有IO請求大致按照先來后到的順序進行操作。之所以說“大致”，原因是NOOP在FIFO的基礎上還做了相鄰IO請求的合並，並不是完完全全按照先進先出的規則滿足IO請求。

CFQ算法的全寫為Completely Fair Queuing。該算法的特點是按照IO請求的地址進行排序，而不是按照先來后到的順序來進行響應。

在傳統的SAS盤上，磁盤尋道花去了絕大多數的IO響應時間。CFQ的出發點是對IO地址進行排序，以盡量少的磁盤旋轉次數來滿足盡可能多的IO請求。在CFQ算法下，SAS盤的吞吐量大大提高了。但是相比於NOOP的缺點是，先來的IO請求並不一定能被滿足，可能會出現餓死的情況。

DEADLINE在CFQ的基礎上，解決了IO請求餓死的極端情況。除了CFQ本身具有的IO排序隊列之外，DEADLINE額外分別為讀IO和寫IO提供了FIFO隊列。讀FIFO隊列的最大等待時間為500ms，寫FIFO隊列的最大等待時間為5s。FIFO隊列內的IO請求優先級要比CFQ隊列中的高，，而讀FIFO隊列的優先級又比寫FIFO隊列的優先級高。優先級可以表示如下：

CFQ和DEADLINE考慮的焦點在於滿足零散IO請求上。對於連續的IO請求，比如順序讀，並沒有做優化。為了滿足隨機IO和順序IO混合的場景，Linux還支持ANTICIPATORY調度算法。ANTICIPATORY的在DEADLINE的基礎上，為每個讀IO都設置了6ms的等待時間窗口。如果在這6ms內OS收到了相鄰位置的讀IO請求，就可以立即滿足。

IO調度器算法的選擇，既取決於硬件特征，也取決於應用場景。

在傳統的SAS盤上，CFQ、DEADLINE、ANTICIPATORY都是不錯的選擇；對於專屬的數據庫服務器，DEADLINE的吞吐量和響應時間都表現良好。然而在新興的固態硬盤比如SSD、Fusion IO上，最簡單的NOOP反而可能是最好的算法，因為其他三個算法的優化是基於縮短尋道時間的，而固態硬盤沒有所謂的尋道時間且IO響應時間非常短。

查看和修改IO調度器的算法非常簡單。假設我們要對sda進行操作，如下所示：

執行 dstat 命令的時候，默認他會收集-cpu-、-disk-、-net-、－paging-、-system-的數據，一秒鍾收集一次。默認輸入 dstat 等於輸入了dstat -cdngy 1或dstat -a 1；

在不帶任務參數的情況它只會collectlcpu、disk、net、paging、system這些數據, 默認是 1s 收集一次. 默認輸入dstat等於輸入了dstat -cdngy 1或dstat-a 1.

-noheaders 只顯示一次表頭以后就不顯示了,使用重定向寫入文件時很有用

上面這些參數大多都容易理解，會點英文的同志都能看懂...........................

實例1: dstat sda -D3 5 #在默認顯示內容的基礎上只顯示sda磁盤的信息

這里的 3 5 意思跟vmstat3 5 一樣，意思就是每隔3秒更新一次，總共更新5次，但是這里有個小區別就是初使時要顯示一次，不包括在內！

實例2：dstat-cdlmnpsy #統計顯示CPU,IO,load,memory,network,process,swap,system

相關各模塊顯示內容跟top、vmstat、iostat等這些工具的意思相同，如cpu相關的usr代表應用空間也就是應用程序所占用的百分比，注意這里也是百分比，sys表示系統內核空間占用的百分比，idl表示CPU空閑情況,wai表示IO等待數，hiq和sig則顯示服務中斷有關信息。

OK，只簡單介紹到這里，這工具應用起來還算比較簡單，顯示也很直觀。工具的使用還需靠平時多去練習、觀察才能熟能生巧！

很多服務端開發的同事和新手運維都來和我討論過如何診斷linux系統的性能瓶頸，今天統一說明。

查找瓶頸有一個基本的流程，不外乎借助系統工具來給系統做一個全面的檢查，最后根據結果來確定問題出在哪方面。

基本流程：

Top的輸出結果那些是很有用的信息呢？我已經全部用紅線框起來了，具體如下：

：load average 這行表示系統最近1分鍾，5分鍾，15分鍾的平均負載。那么怎樣的負載才是可以接受的呢？有個簡單的辦法，在top命令中，再按‘1’鍵，會列出系統使用的cpu的數量，以負載的值不要超過cpu數量最合適。

：Tasks 這行反應的是當前系統的任務狀態，主要看running和zombie進程的數量，一個健康的系統zombie（僵死進程）的數量一定是為0的，否則肯定系統已經出不小的問題了。

：Cpu（s）這行反應當前cpu的工作狀態，us表示用戶進程占整個cpu運行時間的百分比，sy表示系統進程的占用時間百分比；id表示cpu當前的空閑時間百分比，wa表示等待時間百分比，這幾個概念是最重要的。下面有個實際的列子會再詳細分析。

：Swap 這行就是系統交換分區使用狀態，一個性能優越的系統，交換分區使用量一定是為0的，交換分區只是一種應對在系統內存不足時的一種緊急機制，用到交換分區，說明可以考慮增加內存或者裁減現有內存數據大小了。畢竟交換分區就是硬盤，速度和內存差了太多。

2、看硬盤容量，硬盤容量如果爆滿的話，那么什么詭異的情況都可能出現，這個已經非常危急了，具體的命令：df；

3、看帶寬；這里如果細分的話就復雜了，比如是否有網絡攻擊，封包數量和特征是否異常等，zabbix是其中的佼佼者，這里我們只要看目前的帶寬有沒有接近網卡的上限，命令: dstat -n;

這台機器是千兆網卡，現在最大才跑到2.7mbyte/s *8 ～ 20mbit/s，遠遠沒到，帶寬這個很少有機會用到網卡峰值的80%左右，但是在業務繁忙的時候，這個也是非常重要的監控對象。

4、一個具體的實例。昨天一個新同學說應用很卡，延遲較大。內存還有很多不使用，就如上面top圖顯示那樣，還有接近3G可以使用的內存。我等錄上去看了看，使用vmstat：

一、前言

很顯然從名字中我們就可以知道vmstat是一個查看虛擬內存（Virtual Memory）使用狀況的工具，但是怎樣通過vmstat來發現系統中的瓶頸呢？在回答這個問題前，還是讓我們回顧一下Linux中關於虛擬內存相關內容。

二、虛擬內存原理

在系統中運行的每個進程都需要使用到內存，但不是每個進程都需要每時每刻使用系統分配的內存空間。當系統運行所需內存超過實際的物理內存，內核會釋放某些進程所占用但未使用的部分或所有物理內存，將這部分資料存儲在磁盤上直到進程下一次調用，並將釋放出的內存提供給有需要的進程使用。

在Linux內存管理中，主要是通過“調頁Paging”和“交換Swapping”來完成上述的內存調度。調頁算法是將內存中最近不常使用的頁面換到磁盤上，把活動頁面保留在內存中供進程使用。交換技術是將整個進程，而不是部分頁面，全部交換到磁盤上。

分頁(Page)寫入磁盤的過程被稱作Page-Out，分頁(Page)從磁盤重新回到內存的過程被稱作Page-In。當內核需要一個分頁時，但發現此分頁不在物理內存中(因為已經被Page-Out了)，此時就發生了分頁錯誤（Page Fault）。

當系統內核發現可運行內存變少時，就會通過Page-Out來釋放一部分物理內存。經管Page-Out不是經常發生，但是如果Page-out頻繁不斷的發生，直到當內核管理分頁的時間超過運行程式的時間時，系統效能會急劇下降。這時的系統已經運行非常慢或進入暫停狀態，這種狀態亦被稱作thrashing(顛簸)。

三、vmstat詳解

1.用法

vmstat [-a] [-n] [-S unit] [delay [ count]]
vmstat [-s] [-n] [-S unit]
vmstat [-m] [-n] [delay [ count]]
vmstat [-d] [-n] [delay [ count]]
vmstat [-p disk partition] [-n] [delay [ count]]
vmstat [-f]
vmstat [-V]

-a：顯示活躍和非活躍內存

-f：顯示從系統啟動至今的fork數量。

-m：顯示slabinfo

-n：只在開始時顯示一次各字段名稱。

-s：顯示內存相關統計信息及多種系統活動數量。

delay：刷新時間間隔。如果不指定，只顯示一條結果。

count：刷新次數。如果不指定刷新次數，但指定了刷新時間間隔，這時刷新次數為無窮。

-d：顯示磁盤相關統計信息。

-p：顯示指定磁盤分區統計信息

-S：使用指定單位顯示。參數有 k 、K 、m 、M ，分別代表1000、1024、1000000、1048576字節（byte）。默認單位為K（1024 bytes）

-V：顯示vmstat版本信息。
2.使用說明

例子1：每3秒輸出一條結果

字段說明：

Procs（進程）：

r: 運行隊列中進程數量，這個值也可以判斷是否需要增加CPU。（長期大於1）
b: 等待IO的進程數量

Memory（內存）：

swpd: 使用虛擬內存大小

注意：如果swpd的值不為0，但是SI，SO的值長期為0，這種情況不會影響系統性能。
free: 空閑物理內存大小
buff: 用作緩沖的內存大小
cache: 用作緩存的內存大小

注意：如果cache的值大的時候，說明cache處的文件數多，如果頻繁訪問到的文件都能被cache處，那么磁盤的讀IO bi會非常小。

Swap：

si: 每秒從交換區寫到內存的大小，由磁盤調入內存
so: 每秒寫入交換區的內存大小，由內存調入磁盤

注意：內存夠用的時候，這2個值都是0，如果這2個值長期大於0時，系統性能會受到影響，磁盤IO和CPU資源都會被消耗。有些朋友看到空閑內存（free）很少的或接近於0時，就認為內存不夠用了，不能光看這一點，還要結合si和so，如果free很少，但是si和so也很少（大多時候是0），那么不用擔心，系統性能這時不會受到影響的。

IO：（現在的Linux版本塊的大小為1kb）

bi: 每秒讀取的塊數
bo: 每秒寫入的塊數

注意：隨機磁盤讀寫的時候，這2個值越大（如超出1024k)，能看到CPU在IO等待的值也會越大。

系統：

in: 每秒中斷數，包括時鍾中斷。
cs: 每秒上下文切換數。

注意：上面2個值越大，會看到由內核消耗的CPU時間會越大。

CPU（以百分比表示）：

us: 用戶進程執行時間百分比(user time)

注意： us的值比較高時，說明用戶進程消耗的CPU時間多，但是如果長期超50%的使用，那么我們就該考慮優化程序算法或者進行加速。

sy: 內核系統進程執行時間百分比(system time)

注意：sy的值高時，說明系統內核消耗的CPU資源多，這並不是良性表現，我們應該檢查原因。

wa: IO等待時間百分比

注意：wa的值高時，說明IO等待比較嚴重，這可能由於磁盤大量作隨機訪問造成，也有可能磁盤出現瓶頸（塊操作）。

id: 空閑時間百分比

例子2：顯示活躍和非活躍內存

使用-a選項顯示活躍和非活躍內存時，所顯示的內容除增加inact和active外，其他顯示內容與例子1相同。

字段說明：

Memory（內存）：

inact: 非活躍內存大小（當使用-a選項時顯示）
active: 活躍的內存大小（當使用-a選項時顯示）

總結：

目前說來，對於服務器監控有用處的度量主要有：

r（運行隊列）
pi（頁導入）
us（用戶CPU）
sy（系統CPU）
id（空閑）
注意：如果r經常大於4 ，且id經常少於40，表示cpu的負荷很重。如果bi，bo 長期不等於0，表示內存不足。

通過VMSTAT識別CPU瓶頸：
r（運行隊列）展示了正在執行和等待CPU資源的任務個數。當這個值超過了CPU數目，就會出現CPU瓶頸了。

Linux下查看CPU核心數的命令：
cat /proc/cpuinfo|grep processor|wc -l

當r值超過了CPU個數，就會出現CPU瓶頸，解決辦法大體幾種：

1. 最簡單的就是增加CPU個數和核數
2. 通過調整任務執行時間，如大任務放到系統不繁忙的情況下進行執行，進爾平衡系統任務
3. 調整已有任務的優先級

通過vmstat識別CPU滿負荷：

首先需要聲明一點的是，vmstat中CPU的度量是百分比的。當us＋sy的值接近100的時候，表示CPU正在接近滿負荷工作。但要注意的是，CPU 滿負荷工作並不能說明什么，Linux總是試圖要CPU盡可能的繁忙，使得任務的吞吐量最大化。唯一能夠確定CPU瓶頸的還是r（運行隊列）的值。

通過vmstat識別RAM瓶頸：

數據庫服務器都只有有限的RAM，出現內存爭用現象是Oracle的常見問題。

首先用free查看RAM的數量：
[oracle@oracle-db02 ~]$ free
total       used       free     shared    buffers     cached
Mem:       2074924    2071112       3812          0      40616    1598656
-/+ buffers/cache:     431840    1643084
Swap:      3068404     195804    2872600

當內存的需求大於RAM的數量，服務器啟動了虛擬內存機制，通過虛擬內存，可以將RAM段移到SWAP DISK的特殊磁盤段上，這樣會出現虛擬內存的頁導出和頁導入現象，頁導出並不能說明RAM瓶頸，虛擬內存系統經常會對內存段進行頁導出，但頁導入操作就表明了服務器需要更多的內存了，頁導入需要從SWAP DISK上將內存段復制回RAM，導致服務器速度變慢。

解決的辦法有幾種：

1. 最簡單的，加大RAM；
2. 改小SGA，使得對RAM需求減少；
3. 減少RAM的需求。（如：減少PGA）

參考文檔，本人做了相關修改和說明：

http://hi.baidu.com/imlidapeng/blog/item/51872329329ab8335243c1c9.html

http://qa.taobao.com/?p=2269

首先可以通過看硬盤型號，大致判斷硬盤是什么級別的。比如你不能拿企業級的硬盤和家用PC的普通硬盤比，這樣比是沒有價值的。VPS也是沒有測試的必要，因為VPS的性能取決於整個服務器性能，比如一個低配服務器開5個vps，和一個高配服務器開30個vps，這是沒有對比性的。獨立服務器檢測硬盤性能如下，通過dd命令和vmstat命令，僅供技術員墨跡：

幾個獨立服務器的硬盤dd結果參考（注意，dd只有在服務器完全空閑的情況下對比才有意義。如果一個服務器跑了很多應用，一個服務器空閑，那么對比結果是沒有任何意義的）：

[root@host640.ctohome.com]# dd if=/dev/zero of=test bs=64k count=4k oflag=dsync
4096+0 records in
4096+0 records out
268435456 bytes (268 MB) copied, 7.05519 seconds, 38.0 MB/s

[root@host30.ctohome.com]# dd if=/dev/zero of=test bs=64k count=4k oflag=dsync
4096+0 records in
4096+0 records out
268435456 bytes (268 MB) copied, 4.96645 seconds, 54.0 MB/s

[root@host650.ctohome.com]# dd if=/dev/zero of=test bs=64k count=4k oflag=dsync
4096+0 records in
4096+0 records out
268435456 bytes (268 MB) copied, 2.05799 seconds, 130 MB/s

vmstat下表io下面的bi表示讀取和bo表示寫入，單位是block（硬盤讀寫的最小單位是扇區，一個扇區是512 bytes。一次硬盤讀寫的數據量不會超過512 bytes，這一次讀寫的數據量就稱為1個block。在大文件的讀寫操作中，基本可以按乘512來根據block計算出讀寫的實際數據量，誤差很小。）cpu下面的wa，這個wa就是wait的縮寫，代表的意思是CPU在等待硬盤讀寫操作的時間，用百分比表示。wait越大則機器io性能就越差。

[root@host30.ctohome.com]# man vmstat | grep 'block device'
bi: Blocks received from a block device (blocks/s). 讀
bo: Blocks sent to a block device (blocks/s). 寫

CTOHOME提醒：關於bo和bi，到底是讀還是寫，也許你會看到完全相反的2種解釋。這是某些理解錯誤導致的。正確做法，是你自己測試下。首先vmstat 1 1000運行起來，觀察下bo和bi，然后再開一個ssh窗口，運行 du -sh / 這個命令來讀取輸出各個目錄的大小。這里幾乎沒有寫入操作，然后你看看你的bi或bo是否有變化，對CTOHOME的服務器測試結果，明顯，bi變大，說明bi是讀文件。

vmstat 1 1000
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b   swpd   free   buff cache   si   so    bi    bo   in   cs us sy id wa st
5 1   9504 230360 593980 12154304    0    0    24 1316 3170 7063 15 2 83 1 0
3 2   9504 226840 594016 12156884    0    0   180     0 3403 5827 18 3 76 3 0
2 0   9504 238936 594076 12157364    0    0   108    16 3634 2834 17 3 76 4 0
2 0   9504 246568 594084 12157356    0    0   172     0 3315 7355 12 2 84 1 0
3 0   9504 246072 594092 12157400    0    0    12     0 3489 5299 18 2 80 1 0
5 1   9504 246128 594100 12157828    0    0    60 3800 3430 2577 18 3 78 1 0
3 0   9504 243936 594164 12158428    0    0   984 2220 3624 12936 23 3 71 3 0
1 0   9504 249004 594168 12158424    0    0     4     0 3222 2282 12 2 86 0 0
0 0   9504 249192 594208 12158468    0    0    76 2060 3762 5611 9 2 88 1 0
0 0   9504 248256 594216 12158460    0    0    92     0 3471 7062 7 1 90 1 0
3 1   9504 233860 594232 12158880    0    0   144     0 3371 8783 15 2 81 2 0
1 0   9504 232720 594236 12158876    0    0   180    24 3648 19296 33 4 61 3 0
5 0   9504 228440 594260 12159408    0    0    36     0 3589 5185 18 2 79 2 0
4 0   9504 245836 594280 12159824    0    0   264 2820 3743 17055 25 5 67 2 0
2 0   9504 232392 594292 12159816    0    0    92     0 3799 4387 17 3 79 1 0
0 0   9504 248092 594324 12159784    0    0   116 1448 3395 2450 4 2 92 2 0
0 3   9504 241272 594336 12159896    0    0     4 3364 3828 3339 6 1 68 26 0
1 5   9504 245452 594360 12159872    0    0   608 1804 3851 7458 5 2 59 34 0
1 2   9504 246452 594396 12159872    0    0    20   848 3176 3440 1 1 62 36 0
4 2   9504 245352 594488 12160652    0    0   992 1012 3725 9925 16 2 54 28 0
1 0   9504 239124 594504 12161668    0    0    96     4 3283 10042 19 2 77 2 0
0 0   9504 246200 594508 12161664    0    0     0 1716 3707 2144 1 1 98 0 0
1 0   9504 229088 594508 12161664    0    0    16     0 3438 2846 12 3 84 1 0

vmstat 1 1000
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b   swpd   free   buff cache   si   so    bi    bo   in   cs us sy id wa st
2 0      0 217284 116704 397428    0    0 1244   327   80 272 0 0 99 1 0
0 0      0 216424 116716 397416    0    0     8   272 366 1717 0 0 99 0 0
0 0      0 216424 116716 397436    0    0     0     0 310 1590 0 0 100 0 0
0 0      0 216424 116736 397416    0    0    12   420 340 1841 0 0 100 0 0
0 0      0 216424 116744 397436    0    0     4   120 318 1684 0 0 100 0 0
0 0      0 216424 116744 397436    0    0     0     0 302 1612 0 0 100 0 0
0 0      0 216424 116756 397424    0    0     8    96 315 1667 0 0 100 0 0
0 0      0 216424 116756 397424    0    0     0     0 305 1603 0 0 100 0 0
0 0      0 216424 116760 397432    0    0     4   184 323 1738 0 0 100 0 0
0 0      0 216424 116760 397432    0    0     0   168 314 1702 0 0 100 0 0
0 0      0 216432 116764 397432    0    0     4     0 306 1636 0 0 100 0 0
0 0      0 216432 116776 397420    0    0     8    96 314 1634 0 0 100 0 0

服務器宕機原因很多，資源不足、應用、硬件、系統內核bug等，以下一個小例子

服務器宕機了，首先得知道服務器宕機的時間點，然后分析日志查找原因

1.last reboot 此命令可以查看主機起來的時間，不是宕機的時間

reboot system boot 2.4.21-27.ELsmp Mon Sep 16 02:28 (07:02) //這個是主機起來的時間

02:00:00 AM all 48.40 0.00 2.01 2.46 47.13 //這里才是主機宕機的時間，要看宕機原因看着個時間點的日志

Sep 16 02:00:02 ilearndb snmpd[1138]: [smux_accept] accepted fd 11 from 10.0.1.145:46748

Sep 16 02:05:04 ilearndb snmpd[1138]: [smux_accept] accepted fd 11 from 10.0.1.145:46824 //系統里面看到2:05分還有日志，說明2:00的時候主機hang住了，sar已經取不了數據

在看sar的數據，發現（用到了swap，並且使用率在上升），是內存不足導致的主機hang住了。

12:00:00 AM kbmemfree kbmemused %memused kbbuffers kbcached kbswpfree kbswpused %swpused kbswpcad

02:30:00 AM kbmemfree kbmemused %memused kbbuffers kbcached kbswpfree kbswpused %swpused kbswpcad

CPU資源的過度使用，會造成系統中出現大量的等待進程，導致應用程序響應緩慢，而進程的大量增加又會導致系統內存資源的增加，當物理內存耗盡時，系統會使用虛擬內存，而虛擬內存的使用又會造成磁盤IO的增加並加大CPU的開銷。

可以使用很多工具：topas、vmstat、sar、top（命令的使用網上有很多資料介紹）

目前大部分CPU在同一時間只能運行一個線程，超線程的處理器可以在同一時間處理多個線程，因此可以利用超線程特性提高系統性能。

在linux系統下只有運行SMP內核才能支持超線程，但是安裝的CPu數量越多，從超線程獲得的性能提升越少。

另外linux內核會將多核的處理器當做多個單獨的CPU來識別，例如，兩個4核的CPU會被當成8個單個CPU，從性能角度講，兩個4核的CPU整體性能要比8個單核CPU低25%-30%。

memory

swap

system

CPU

內存不足時，可以使用工具觀察到頻繁使用虛擬內存，虛擬內存可以緩解物理內存的不足，但是虛擬內存的過多占用會導致應用程序的性能明顯下降。

總結論：操作建議：



序號	檢查點	檢查方法	判斷依據	結果判斷
1	系統的Uptime時間	uptime last reboot	如果發現系統uptime時間很短，則需要檢查系統是否重啟過檢查系統最近的重啟時間
2	檢查文件系統的使用率	df -h du -hs * \| sort -n (*用目錄路徑代替)	對於OS的文件系統，如果發現使用率高於90%就應該再進一步檢查是什么原因引起的文件系統使用率上漲。對於應用系統使用的文件系統，我們重點在於發現有沒有文件系統使用率到達95%以上，若有，把情況報告給相關的人員。
3	檢查網絡狀態	ping	網絡連通性檢查
		ifconfig	檢查當前處於up狀態的網卡
		mii-tool	link ok 顯示各個網卡所接鏈路的狀況
		ethtool eth[n]	查看指定網卡所接鏈路的狀況
		ls -al /etc/resolv.conf ls -al /etc/nsswitch.conf	確保以上文件的權限是other可讀
		cat /etc/hosts	主機名在hosts文件中只應該與機器的物理IP映射，如果出現有機器的浮動IP與主機映射就需要做進一步檢查
		netstat –rn ip route ls table f5 ip rule ls	正常情況下應該只設置了網關，而沒有其它的靜態路由，如果在列表中發現有其它的路由，則需要確認是否正確
		view /etc/sysconfig/network-scripts/ifcfg-eth*	先檢查子網掩碼設置是否正確再檢查是否ip是否吻合
4	檢查ntp時間服務器設置	ntpq -p	正常情況下應該有如下輸出信息： [root@cnsz01pl0041 ~]# ntpq -p remote refid st t when poll reach delay offset jitter ============================================================================== *10.0.16.238 118.143.17.82 2 u 24d 1024 0 3.684 0.247 0.000
5	進程狀態	ps –ef \| grep defunct；ps -ef \| wc -l；ps -ef \| grep -v root \| wc -l	如果系統中存在大量的僵屍進程則屬於異常的狀態需要檢查處理。如果只是個別進程就不需要處理。
6	內存狀態	free -m	檢查內存使用情況
7	swap狀態	swapon -s	查看swap使用百分比
8	檢查機器性能	vmstat	CPU：如果cpu的id字段長時間<10，該機器的CPU負載比較高 MEM：si和so字段頻繁>0,則說明該機器的內存使用比較緊張 DISK：如果bi和bo頻繁出現大數字，則說明該機器對磁盤的讀寫比較頻繁。
9	檢查磁盤性能	iostat	檢查iowait 時長是否過大？
10	檢查系統日志	view /var/log/messages	可以通過檢索error,fail,warn等字眼加快檢查的速度關注syslog中關於IO過程的提示信息，有無IO中斷，IO丟失，SCSI reset等等
11	收集系統日志	sosreport -a --batch	收集系統日志
12	收集硬件日志	DSET smartCD	Dell PC Server ：用DSET 工具收集硬件日志 HP PC Server：視情況用smartCD收集硬件日志