聊聊ab、wrk、JMeter、Locust這些壓測工具的並發模型差別

本文轉載自查看原文 2021-02-18 14:14 325

原文連接：https://mp.weixin.qq.com/s?__biz=MzA4NTYwOTE3MQ==&mid=2452533021&idx=1&sn=c4d4ae2b60aed77f6ab820ca4ba6cfe7&chksm=880f50a1bf78d9b751bb420c6f8d4727a5aaa57b862855fe6dd69c9ba7573b961dc4de236a52&token=1367783642&lang=zh_CN

選擇壓測工具是在選什么？

壓力測試是測試工程師日常工作中一項比較“有技術含量”的工作，很多人都對這項工作充滿了好奇。除了少數特殊場景得靠自己開發壓測腳本外，大部分壓測工作是可以選用成熟的壓測工具來進行的。壓測工具有非常多，有開源的、有商業化的，我下面羅列一些常見的：

工具	項目地址
ApacheBench	https://httpd.apache.org/docs/2.4/programs/ab.html
wrk	https://github.com/wg/wrk
Apache JMeter	https://jmeter.apache.org/
Locust	https://locust.io/
K6	https://k6.io/
Artillery	https://artillery.io/

除了LoadRunner這種商業壓測工具之外，大部分測試人員在壓測工具的選型時最重要的一點：是否熟悉。這種熟悉往往是出於過往的工作經歷、身邊同事的推薦、網上教程的多寡、腳本語言等因素。比如我在很多年前開始用Locust時，就是因為我個人擅長Python開發語言，即便在當時幾乎沒有中文教程。

但我在使用Locust一段時間之后，大約在2015年中，我意識到Locust作為一款壓測工具，其能夠產生的壓力好像遠遠遜色於JMeter之類，於是開始關注壓測工具背后的並發模型，去理解不同壓測工具運行邏輯，嘗試去解釋我看到的性能差異。

同步、異步、阻塞、非阻塞

要講並發模型，我們繞不開以下四個名詞：

同步（Synchronous）
異步（Asynchronous）
阻塞（Blocking)
非阻塞（Nonblocking）

而且我還要特地指出：目前你能通過搜索引擎找到的、能准確解釋這四個概念的中文資料，是極少的。

我這邊不會班門弄斧地來解釋這四個詞的差別，只是提一些大部分資料中忽視的點：

要區分同步、異步，必須講清楚其所處的層，比如框架、用戶空間、內核、IO模型
同步調用發起后，沒有得到結果不返回，那么毫無疑問就是被阻塞了
異步調用發起后直接返回，毫無疑問，這個進程沒有被阻塞

在Operating System Concepts [9th Edition]該書中描述對進程間通信進行了一些描述

也就是說，站在進程通信緯度上來看，阻塞、非阻塞與同步、異步是同義詞，但是需要區分發送方、接收方：

阻塞發送
非阻塞發送
阻塞接受
非阻塞接受

上述不同類型的發送方法和不同類型的接收方法可以自由組合

另外，我們還知道Linux有五種I/O模型：

阻塞式IO（Blocking I/O）
非阻塞式IO（Nonblocking I/O）
IO復用（I/O multiplexing）

select
poll
epoll

信號驅動式IO（Signal Driver I/O）
異步IO（Asynchronous I/O）

以上1-4其實都是同步IO，只有第五種模型才是異步IO

了解以上這些概念后，我們再來講講文章標題中提到的這些壓測工具背后的並發模型

基於多線程並發的ab、JMeter

ab、JMeter分別是用C、Java開發的、基於多線程並發模型的壓測工具，也是目前最流行的開源壓測工具，兩者的工作原理類似，如下圖：

多線程並發

不管ab還是JMeter，其所謂的虛擬用戶(vuser)就是對應一個線程
在單個線程中，每個請求（query）都是同步調用的，下一個請求要等待前一個請求完成才能進行
一個請求（query）分成三部分：

send - 施壓端發送開始，直到承壓端接收完成
wait - 承壓端接收完成開始，直至業務處理結束
recv - 承壓端返回數據，直至施壓端接收完成

同一線程中連續的兩個請求之間存在等待時間這種概念，即圖中的空白處

在多線程並發模型下，是不是可以通過不斷增加線程數量生產出更大的壓力？

答案是否定的。

事實上一個進程在一個時間點只能執行一個線程，而所謂的並發是指在進程里不斷切換線程實現了看上去的多個任務的並發，但是線程上下文切換有很高的成本，過多的線程數反而會造成性能的嚴重下滑。

BIO

從應用角度來看，基於多線程的並發模型，往往需要設置最大並發數參數，而如果壓測場景需要不斷往上加壓，那這類工具其實挺難應付的。

wrk為什么比ab快？

wrk是一款很類似ab的壓測工具，同樣是使用C語言開發，不過更加的『現代化』：

wrk is a modern HTTP benchmarking tool capable of generating significant load when run on a single multi-core CPU. It combines a multithreaded design with scalable event notification systems such as epoll and kqueue.

我們通過wrk的執行參數來來解釋其並發模型：