Solaris內存監控 & solaris查看內存使用情況 LINUX下查看CPU使用率的命令


Solaris內存監控
 
Solaris內存主要用在以下幾個方面:核心,進程,文件系統緩存。如下是監控內存使用的方法。

可用系統物理內存 

分配給Solaris核心的內存數量 

文件系統緩存使用的內存數量 

進程使用的內存數量 

系統剩余的內存數量

Total Physical Memory

使用prtconf命令,察看系統物理內存數量。

prtconf | head -2

System Configuration: Sun Microsystems sun4u

Memory size: 49152 Megabytes

Kernel Memory

使用sar –k察看系統核心占用的內存,如下3個內存池之和即是,單位byte

sar -k 1 1

SunOS lonespappb33 5.8 Generic_117350-13 sun4u 11/28/05

05:39:26 sml_mem alloc fail lg_mem alloc fail ovsz_alloc fail

05:39:28 483386752 202156800 0 4400701440 2886180864 0 656105472 0

File System Caching Memory

文件系統緩存使用系統可用的剩余內存緩存文件。在Solaris上,可用的剩余內存(free memory)大部分情況下總是接近0;Solaris8之前,vmstat 顯示的free列表示可用的剩余內存,往往在系統啟動(booted)的時候很高,隨着系統運行慢慢降低為0,這是正常的,因為文件系統緩存的設計目的就是最大化利用系統可用內存來緩存最經常訪問的文件。

在Solaris8中,vmstat 顯示的free是系統可用的剩余內存(free memory)和可pageable的文件系統緩存(file system cache memory),man的解釋:free size of the free list (Kbytes) 。文件系統緩存也掛在內存Free List上。

vmstat 1 5

procs memory page disk faults cpu

r b w swap free re mf pi po fr de sr s0 s1 s2 s3 in sy cs us sy id

0 1 0 62618064 33156520 5220 0 1144 0 0 0 0 0 1 0 0 8093 47291 1895 9 7 85

如上Solaris 8,vmstat 結果表示,文件系統緩存占用了將近33156520k內存。

Free Memory

由於文件系統緩存總是盡量利用可用的剩余內存緩存文件,因此大部分情況下Free memory總是接近0.

Memory Shortage Detection

系統運行時會不斷的page in page out;繁忙的paging操作,可導致Page Scaner運行頻繁,因此伴隨有較高的scan-rage(sr)和page-out(po);這可以作為系統繁忙paging 的表示。

如果有進程被swap(w>0),則通常表示內存短缺,這時候往往swap設備的IO比較繁忙。

Swap Space

Solaris 交換空間(swap space)有2個重要的狀態:保留(swap reservation)和分配(physical swap allocation). 

保留(swap reservation)是指Process創建segment的時候,系統分配給Process虛擬的內存地址空間(virtual memory address space),同時為了保證該segment以后可以被page out到swap,分配給Process與該segment同樣大小的虛擬交換空間(virtual swap space). 

例如,process創建一個100M的segment,系統會分配給該process100M的virtual memory address space,但不會分配給process物理內存(physical memory);同時在Swap space中預先保留(reservation)100M虛擬交換空間(virtual swap space). 

分配(physical swap allocation)是指segment driver給process segment分配物理內存時,預先為swap reservation區分配同樣大小的物理交換空間(physical swap space),用來page-out.

例如,process在已有100M的virtual memory address space基礎上,通過trap/page-fault/zero-fill-on-demand分配到10M的物理內存;同時會為預先保留(reservation)的100M虛擬交換空間(virtual swap space)分配10M物理swap space.

Virtual Swap Space

系統虛擬交換空間的數量為物理磁盤交換空間大小(disk swap space)+Solaris在內存中分配的交換空間大小(memory swap space).使用swap –s察看虛擬交換空間信息。

$ swap -s

total: 929688k bytes allocated + 57408k reserved = 987096k used, 17715000k available

Physical Swap Space

系統物理交換空間的數量為/etc/vfstab中配置的磁盤交換空間大小。使用swap –l察看。

$ swap -l

swapfile dev swaplo blocks free

/dev/vx/dsk/swapvol 230,6 16 25165808 25165808

必須確保swap –s和swap –l 的available & free 非0,否則將無法分配虛擬交換內存或者物理交換內存;

此時,Oracle通常會遇見ORA-4030和ORA-12500錯誤。

可計算memory swap space: 987,096k+17,715,000k-25165808/2k=6,119,192k

Process Memory Usage , ps, and pmap

進程的內存也可分為2種,虛擬內存使用和物理內存使用。進程虛擬內存是指已經分配給進程的虛擬地址空間(virtual address space);物理內存是指分配給進程的真實的物理內存(real physical memory pages)數量。

Ps的vsz表示虛擬內存,rss表示物理內存

$ ps -opid,vsz,rss,args

PID VSZ RSS COMMAND

27495 1912 1016 –ksh
 
 
 
 
=======================================================================
 
solaris查看內存使用情況命令
 
1>ps -efo pmem,uid,pid,ppid,pcpu,comm | sort -r
用PS命令的-o選項來實現,這些選項有:user ruser group rgroup uid ruid gid rgid pid ppid pgid sid taskid ctid pri opri pcpu pmem vsz rss osz nice class time etime stime zone zoneid f s c lwp nlwp psr tty addr wchan fname comm args projid project pset
具體的意思可以man ps來查看。
 
查看solaris內存使用情況,按占用內存大小排序 
ps -efo pmem,uid,pid,ppid,pcpu,comm | sort -r
 
pmem   The ratio of the process's resident  set size  to  the  physical  memory  on 
       the machine, expressed as a percentage.
 
如果你不知道這個命令都帶有什么選項, ps help即可。
 
2> # prtconf -vp | grep Mem
prtconf 命令在/usr/sbin下,這個命令可以得到總內存。其實也不用這么麻煩,top命令看到的信息更多。
 
3> echo ::memstat | mdb -k
例如:
# echo ::memstat | mdb -k
Page Summary                Pages                MB  %Tot
------------     ----------------  ----------------  ----
Kernel                      75297               588    7%
Anon                       888409              6940   86%
Exec and libs               28196               220    3%
Page cache                  15958               124    2%
Free (cachelist)            17993               140    2%
Free (freelist)              3162                24    0%
Total                     1029015              8039
Physical                  1026087              8016
 
具體解釋:
Kernel: Kernel pages
Anon: anonymous pages (such as stack, heap, shared mem etc)
Exec and libs: executables and libraries 
Page cache:  file cache
Free (cachelist) + Free (freelist) = freemem(vmstat 中的free值)
這個命令運行起來時間比較長。
 
4>prstat -a
 *PID      :進程的進程 ID。
 *USERNAME :真實用戶(登錄)名稱或真實用戶 ID。
 *SIZE     :進程的總虛擬內存大小,以 K、M 或 G 為單位。
 *RSS      :進程的駐留集大小 (RSS),以 K、M 或 G 為單位。(RSS是進程駐留內存的大小,SIZE是進
             程總共的大小。一般SIZE要大於RSS,至於SIZE大於RSS的部分就放到了SWAP區里了)
 *STATE    :進程的狀態 (cpuN/sleep/wait/run/zombie/stop)。
 *PRI      :進程的優先級。數字更大表示優先級更高。
 *NICE     :優先級計算中使用的 nice 值。只有特定調度類中的進程才有 nice 值。
 *TIME     :進程的累計執行時間。
 *CPU      :進程使用的當前 CPU 時間的百分比。如果在非全局域中執行並且池設備是活動的,百分比將
             zone綁定的池所使用的處理器集合中處理器的百分比。
 *PROCESS  :進程的名稱(執行文件的名稱)。
 *NLWP     :進程中 lwps 的數量
 
中間還有個參數:系統平均負載(Load average)在Linux系統中,uptime、w、top等命令都會有系統平均負載load average的輸出.
命令輸出的最后內容表示在過去的1、5、15分鍾內運行隊列中的平均進程數量。 只要每個CPU的當前活動進程數不大於3那么系統的性能就是良好的,如果每個CPU的任務數大於5,那么就表示這台機器的性能有嚴重問題。load average/cpu_num< 3 就是性能不錯的。
順便提一下,多個CPU狀態查看命令:mpstat
 
5>vmstat 3 4
看vmstat的輸出時,從第2行開始看,如果sr列數值比較大,就表明內存緊張。

 
6>top
 
7>sar -r 5 5 
sar -r標示的freemem顯示的是空閑的頁面數,而不是用k來衡量的,它表示的數值與vmstat差不多。
它們顯示的free memory都還包括高速文件緩存占用的的內存,並不是真正沒有使用的內存。

比如:vmstat顯示的內存有152528k,sar -r顯示的是18933個pages,一個page大約8k,用18933乘以8,還是差不多150M.但實際上呢,真正意義上空閑的內存只有6個M(用專門的memtool測量的),而不是152M。

 

 

1.top

使用權限:所有使用者

使用方式:top [-] [d delay] [q] [c] [S] [s] [i] [n] [b]

說明:即時顯示process的動態

d :改變顯示的更新速度,或是在交談式指令列( interactive command)s

q :沒有任何延遲的顯示速度,如果使用者是有superuser的權限,則top將會以最高的優先序執行

c :切換顯示模式,共有兩種模式,一是只顯示執行檔的名稱,另一種是顯示完整的路徑與名稱S :累積模式,會將己完成或消失的子行程( dead child process )CPU time累積起來

s :安全模式,將交談式指令取消,避免潛在的危機

i :不顯示任何閑置(idle)或無用(zombie)的行程

n :更新的次數,完成后將會退出top

b :批次檔模式,搭配"n"參數一起使用,可以用來將top的結果輸出到檔案內

 

范例:

顯示更新十次后退出;

top -n 10

 

使用者將不能利用交談式指令來對行程下命令:

top -s

 

將更新顯示二次的結果輸入到名稱為top.log的檔案里:

top -n 2 -b < top.log   

另附一個命令簡介linux traceroutewindows tracert兩個命令相當,跟蹤網絡路由

 

2.vmstat

正如我們之前討論的任何系統的性能比較都是基於基線的,並且監控CPU的性能就是以上3點,運行隊列、CPU使用率和上下文切換。以下是一些對於CPU很普遍的性能要求:

1.對於每一個CPU來說運行隊列不要超過3,例如,如果是雙核CPU就不要超過6

2.如果CPU在滿負荷運行,應該符合下列分布,

a) User Time65%70%

b) System Time30%35%

c) Idle0%5%

3. mpstat

對於上下文切換要結合CPU使用率來看,如果CPU使用滿足上述分布,大量的上下文切換也是可以接受的。

常用的監視工具有:vmstat, top,dstatmpstat.

# vmstat 1

procs -----------memory---------- ---swap-- -----io---- --system-- ----cpu----

r b swpd free buff cache si so bi bo in cs us sy id wa

0 0 104300 16800 95328 72200 0 0 5 26 7 14 4 1 95 0

0 0 104300 16800 95328 72200 0 0 0 24 1021 64 1 1 98 0

0 0 104300 16800 95328 72200 0 0 0 0 1009 59 1 1 98 0

r表示運行隊列的大小,

b表示由於IO等待而block的線程數量,

in表示中斷的數量,

cs表示上下文切換的數量,

us表示用戶CPU時間,

sys表示系統CPU時間,

wa表示由於IO等待而是CPU處於idle狀態的時間,

id表示CPU處於idle狀態的總時間。

dstat可以給出每一個設備產生的中斷數:

# dstat -cip 1

----total-cpu-usage---- ----interrupts--- ---procs---

usr sys idl wai hiq siq| 15 169 185 |run blk new

6 1 91 2 0 0| 12 0 13  | 0 0 0

1 0 99 0 0 0| 0    0  6 | 0 0 0

0 0 100 0 0 0| 18 0  2 | 0 0 0

0 0 100 0 0 0| 0    0  3 | 0 0 0

我們可以看到這里有3個設備號15169185.設備名和設備號的關系我們可以參考文件/proc/interrupts,這里185代表網卡eth1.

# cat /proc/interrupts

CPU0

0: 1277238713 IO-APIC-edge timer

6: 5 IO-APIC-edge floppy

7: 0 IO-APIC-edge parport0

8: 1 IO-APIC-edge rtc

9: 1 IO-APIC-level acpi

14: 6011913 IO-APIC-edge ide0

15: 15761438 IO-APIC-edge ide1

169: 26 IO-APIC-level Intel 82801BA-ICH2

185: 16785489 IO-APIC-level eth1

193: 0 IO-APIC-level uhci_hcd:usb1

mpstat可以顯示每個CPU的運行狀況,比如系統有4CPU。我們可以看到:

# mpstat –P ALL 1

Linux 2.4.21-20.ELsmp (localhost.localdomain) 05/23/2006

05:17:31 PM CPU %user %nice %system %idle intr/s

05:17:32 PM all 0.00 0.00 3.19 96.53 13.27

05:17:32 PM 0 0.00 0.00 0.00 100.00 0.00

05:17:32 PM 1 1.12 0.00 12.73 86.15 13.27

05:17:32 PM 2 0.00 0.00 0.00 100.00 0.00

05:17:32 PM 3 0.00 0.00 0.00 100.00 0.00

總結的說,CPU性能監控包含以下方面:

檢查系統的運行隊列,確保每一個CPU的運行隊列不大於3.

確保CPU使用分布滿足70/30原則(用戶70%,系統30%)。

如果系統時間過長,可能是因為頻繁的調度和改變優先級。

CPU Bound進程總是會被懲罰(降低優先級)而IO Bound進程總會被獎勵(提高優先級)。

 

4.prstat命令

要顯示系統上當前運行的進程和項目的各種統計信息,請使用帶有-J選項的prstat命令:

 

%prstat -J

        PID USERNAME SIZE  RSS STATE PRI NICE     TIME CPU PROCESS/NLWP

 21634 jtd     5512K 4848K cpu0   44   0  0:00.00 0.3% prstat/1

  324 root      29M  75M sleep  59   0  0:08.27 0.2% Xsun/1

 15497 jtd       48M  41M sleep  49   0  0:08.26 0.1% adeptedit/1

  328 root    2856K 2600K sleep  58   0  0:00.00 0.0% mibiisa/11

 1979 jtd     1568K 1352K sleep  49   0  0:00.00 0.0% csh/1

 1977 jtd     7256K 5512K sleep  49   0  0:00.00 0.0% dtterm/1

  192 root    3680K 2856K sleep  58   0  0:00.36 0.0% automountd/5

 1845 jtd       24M  22M sleep  49   0  0:00.29 0.0% dtmail/11

 1009 jtd     9864K 8384K sleep  49   0  0:00.59 0.0% dtwm/8

  114 root    1640K 704K sleep  58   0  0:01.16 0.0% in.routed/1

  180 daemon  2704K 1944K sleep  58   0  0:00.00 0.0% statd/4

  145 root    2120K 1520K sleep  58   0  0:00.00 0.0% ypbind/1

  181 root    1864K 1336K sleep  51   0  0:00.00 0.0% lockd/1

  173 root    2584K 2136K sleep  58   0  0:00.00 0.0% inetd/1

  135 root    2960K 1424K sleep   0   0  0:00.00 0.0% keyserv/4

PROJID   NPROC SIZE  RSS MEMORY     TIME CPU PROJECT

   10      52 400M 271M   68%  0:11.45 0.4% booksite

    0      35 113M 129M   32%  0:10.46 0.2% system

 

Total: 87 processes, 205 lwps, load averages: 0.05, 0.02, 0.02

要顯示系統上當前運行的進程和任務的各種統計信息,請使用帶有-T選項的prstat命令:

 

%prstat -T

  PID USERNAME SIZE  RSS STATE PRI NICE     TIME CPU PROCESS/NLWP

 23023 root      26M  20M sleep  59   0  0:03:18 0.6% Xsun/1

 23476 jtd       51M  45M sleep  49   0  0:04:31 0.5% adeptedit/1

 23432 jtd     6928K 5064K sleep  59   0  0:00:00 0.1% dtterm/1

 28959 jtd       26M  18M sleep  49   0  0:00:18 0.0% .netscape.bin/1

 23116 jtd     9232K 8104K sleep  59   0  0:00:27 0.0% dtwm/5

 29010 jtd     5144K 4664K cpu0   59   0  0:00:00 0.0% prstat/1

  200 root    3096K 1024K sleep  59   0  0:00:00 0.0% lpsched/1

  161 root    2120K 1600K sleep  59   0  0:00:00 0.0% lockd/2

  170 root    5888K 4248K sleep  59   0  0:03:10 0.0% automountd/3

  132 root    2120K 1408K sleep  59   0  0:00:00 0.0% ypbind/1

  162 daemon  2504K 1936K sleep  59   0  0:00:00 0.0% statd/2

  146 root    2560K 2008K sleep  59   0  0:00:00 0.0% inetd/1

  122 root    2336K 1264K sleep  59   0  0:00:00 0.0% keyserv/2

  119 root    2336K 1496K sleep  59   0  0:00:02 0.0% rpcbind/1

  104 root    1664K 672K sleep  59   0  0:00:03 0.0% in.rdisc/1

TASKID   NPROC SIZE  RSS MEMORY     TIME CPU PROJECT                    

  222      30 229M 161M   44%  0:05:54 0.6% group.staff                

  223       1  26M  20M  5.3%  0:03:18 0.6% group.staff                

   12       1  61M  33M  8.9%  0:00:31 0.0% group.staff                

    1      33  85M  53M   14%  0:03:33 0.0% system                     

 

Total: 65 processes, 154 lwps, load averages: 0.04, 0.05, 0.06      


-J-T選項不能一起使用。 

 

 

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM