sysbench是一個模塊化的、跨平台、多線程基准測試工具,主要用於評估測試各種不同系統參數下的數據庫負載情況。關於這個項目的詳細介紹請看:https://github.com/akopytov/sysbench 。
它主要包括以下幾種方式的測試:
- cpu性能
- 磁盤io性能
- 調度程序性能
- 內存分配及傳輸速度
- POSIX線程性能
- 數據庫性能(OLTP基准測試)
sysbench的數據庫OLTP測試支持MySQL、PostgreSQL、Oracle,目前主要用於Linux操作系統,開源社區已經將sysbench移植到了Windows,並支持SQL Server的基准測試。
廢話不多說,開始。
1. sysbench安裝
- mysql版本: mysql-community-server-5.6.29
- OS: CentOS 6.7 X86_64
- sysbench 0.5相比0.4版本有一些變化,包括oltp測試結合了lua腳本,還多了一些隱藏選項,本文會涉及得到一部分。
目前許多倉庫里已編譯好的二進制sysbench還是0.4.x版本,不過現在主流也還是github上的0.5(我這里使用的是1.0),可以從 這里下載0.5版本的rpm包直接安裝,不過我選擇自己編譯,因為只有這個辦法是通用的。
2. 使用sysbench對mysql壓測
2.1 只讀示例
./bin/sysbench --test=share/sysbench/oltp.lua \
--mysql-host=10.229.153.175 --mysql-port=7001 --mysql-user=kp --mysql-password=kp123456 \
--mysql-db=conanwang --oltp-tables-count=10 --oltp-table-size=10000000 \
--report-interval=10 --oltp-dist-type=uniform --rand-init=on --max-requests=0 \
--oltp-test-mode=nontrx --oltp-nontrx-mode=select \
--oltp-read-only=on --oltp-skip-trx=on \
--max-time=120 --num-threads=12 \
prepare
來准備好表和數據,run
執行真正的壓測,cleanup
用來清除數據和表。實際prepare的表結構:
上面的測試命令代表的是:對mysql進行oltp基准測試,表數量10,每表行數約1000w(幾乎delete多少就會insert的多少),並且是非事務的只讀測試,持續60s,並發線程數12。
需要說明的選項:
mysql-db=dbtest1a
:測試使用的目標數據庫,這個庫名要事先創建--oltp-tables-count=10
:產生表的數量--oltp-table-size=10000000
:每個表產生的記錄行數--oltp-dist-type=uniform
:指定隨機取樣類型,可選值有 uniform(均勻分布), Gaussian(高斯分布), special(空間分布)。默認是special--oltp-read-only=off
:表示不止產生只讀SQL,也就是使用oltp.lua時會采用讀寫混合模式。默認 off,如果設置為on,則不會產生update,delete,insert的sql。--oltp-test-mode=nontrx
:執行模式,這里是非事務式的。可選值有simple,complex,nontrx。默認是complex- simple:簡單查詢,SELECT c FROM sbtest WHERE id=N
- complex (advanced transactional):事務模式在開始和結束事務之前加上begin和commit, 一個事務里可以有多個語句,如點查詢、范圍查詢、排序查詢、更新、刪除、插入等,並且為了不破壞測試表的數據,該模式下一條記錄刪除后會在同一個事務里添加一條相同的記錄。
- nontrx (non-transactional):與simple相似,但是可以進行update/insert等操作,所以如果做連續的對比壓測,你可能需要重新cleanup,prepare。
-
--oltp-skip-trx=[on|off]
:省略begin/commit語句。默認是off -
--rand-init=on
:是否隨機初始化數據,如果不隨機化那么初始好的數據每行內容除了主鍵不同外其他完全相同 --num-threads=12
: 並發線程數,可以理解為模擬的客戶端並發連接數--report-interval=10
:表示每10s輸出一次測試進度報告--max-requests=0
:壓力測試產生請求的總數,如果以下面的max-time
來記,這個值設為0--max-time=120
:壓力測試的持續時間,這里是2分鍾。
注意,針對不同的選項取值就會有不同的子選項。比如oltp-dist-type=special
,就有比如oltp-dist-pct=1
、oltp-dist-res=50
兩個子選項,代表有50%的查詢落在1%的行(即熱點數據)上,另外50%均勻的(sample uniformly)落在另外99%的記錄行上。
再比如oltp-test-mode=nontrx
時, 就可以有oltp-nontrx-mode
,可選值有select(默認), update_key, update_nokey, insert, delete,代表非事務式模式下使用的測試sql類型。
以上代表的是一個只讀的例子,可以把num-threads
依次遞增(16,36,72,128,256,512),或者調整my.cnf參數,比較效果。另外需要注意的是,大部分mysql中間件對事務的處理,默認都是把sql發到主庫執行,所以只讀測試需要加上oltp-skip-trx=on
來跳過測試中的顯式事務。
ps1: 只讀測試也可以使用share/tests/db/select.lua
進行,但只是簡單的point select。
ps2: 我在用sysbench壓的時候,在mysql后端會話里有時看到大量的query cache lock,如果使用的是uniform取樣,最好把查詢緩存關掉。當然如果是做兩組性能對比壓測,因為都受這個因素影響,關心也不大。
2.2 混合讀寫
讀寫測試還是用oltp.lua,只需把--oltp-read-only
等於off
。
然而oltp-test-mode=nontrx
一直沒有跟着我預期的去走,在mysql general log里面看到的sql記錄與complex
模式相同。所以上面示例中的--oltp-test-mode=nontrx --oltp-nontrx-mode=select
可以刪掉。
update:
sysbench作者 akopytov 對我這個疑問有了回復:https://github.com/akopytov/sysbench/issues/34 ,原來sysbench 0.5版本去掉了這個選項,因為作者正在准備1.0版本,所以也就沒有更新0.5版本的doc。網上的博客漫天飛,就沒有一個提出來的,也是沒誰了。
分析一下oltp.lua腳本內容,可以清楚單個事務各操作的默認比例:select:update_key:update_non_key:delete:insert = 14:1:1:1:1,可通過oltp-point-selects
、oltp-simple-ranges
、oltp-sum-ranges
、oltp-order-ranges
、oltp-distinct-ranges
,oltp-index-updates
、oltp-non-index-updates
這些選項去調整讀寫權重。
同只讀測試一樣,在atlas,mycat這類中間件測試中如果不加oltp-skip-trx=on
,那么所有查詢都會發往主庫,但如果在有寫入的情況下使用--oltp-skip-trx=on
跳過BEGIN和COMMIT,會出現問題:
ALERT: failed to execute MySQL query:
INSERT INTO sbtest4 (id, k, c, pad) VALUES (48228, 47329, '82773802508-44916890724-85859319254-67627358653-96425730419-64102446666-75789993135-91202056934-68463872307-28147315305', '13146850449-23153169696-47584324044-14749610547-34267941374')
:
ALERT: Error 1062 Duplicate entry ‘48228’ for key ‘PRIMARY’
FATAL: failed to execute function `event’: (null)
原因也很容易理解,每個線程將選擇一個隨機的表,不加事務的情況下高並發更新(插入)出現重復key的概率很大,但我們壓測不在乎這些數據,所以需要跳過這個錯誤--mysql-ignore-errors=1062
,這個問題老外有出過打補丁的方案允許--mysql-ignore-duplicates=on
,但作者新加入的忽略錯誤碼這個功能已經取代了它。mysql-ignore-errors
選項是0.5版本加入的,但目前沒有文檔標明,也是我在github上提的 issue 作者回復的。
這里不得不佩服老外的辦事效率和責任心,提個疑惑能立馬得到回復,反觀國內,比如在atlas,mycat項目里提到問題到現在都沒人搭理。。。
2.3 只更新
如果基准測試的時候,你只想比較兩個項目的update(或insert)效率,那可以不使用oltp腳本,而直接改用update_index.lua
:
此時像oltp-read-only=off
許多參數都失效了。需要說明的是這里 (非)索引更新,不是where條件根據索引去查找更新,而是更新索引列上的值。
3. 結果解讀
我們一般關注的用於繪圖的指標主要有:
- response time avg: 平均響應時間。(后面的95%的大小可以通過
--percentile=98
的方式去更改) - transactions: 精確的說是這一項后面的TPS 。但如果使用了
-oltp-skip-trx=on
,這項事務數恆為0,需要用total number of events
去除以總時間,得到tps(其實還可以分為讀tps和寫tps) - read/write requests: 用它除以總時間,得到吞吐量QPS
- 當然還有一些系統層面的cpu,io,mem相關指標
sysbench還可以對文件系統IO測試,CPU性能測試,以及內存分配與傳輸速度測試,這里就不介紹了。
總結起來sysbench的缺點就是,模擬的表結構太簡單,不像tpcc-mysql那樣完整的事務系統。但對於性能壓測對比還是很有用的,因為sysbench使用的環境參數限制是一樣的。