最近因為科研需求,一直在研究Google的開源RE2庫(正則表達式識別庫),庫源碼體積龐大,用C++寫的,對於我這個以前專供Java的人來說真的是一件很痛苦的事,每天只能啃一點點。今天研究了下里面用到的測試方法,感覺挺好的,拿來跟大家分享下!(哈~C++大牛勿噴)
對於我這個C++菜鳥中的菜鳥而言,平時寫幾個函數想要測試一般都是在main中一個一個的測試,因為沒用C++寫過項目,沒有N多方法所以在main中一個個測試也不費勁。但是對於一個項目而言,或多或少都有N多方法,如果在main中一個個測試的話,不僅效率低而且還容易出錯遺漏什么的。那么該怎么進行測試呢?貌似現在有很多C++自動化測試的工具,反正我是一個沒用過,也沒法評價。我就說下Google在RE2庫里是怎么測試的吧。
先用一個超級簡單的例子來做講解:測試兩個方法getAsciiNum()和getNonAsciiNum(),分別求flow中ASCII碼字符的數目和非ASCII碼字符的數目。
第一步:寫個頭文件,定義測試所用類和測試方法。
// test.h
#define TEST(x, y) \ void x##y(void); \ TestRegisterer r##x##y(x##y, # x "." # y); \ void x##y(void) void RegisterTest(void (*)(void), const char*); class TestRegisterer { public: TestRegisterer(void (*fn)(void), const char *s) { RegisterTest(fn, s); } };
解析:首先看定義的類TestRegisterer,有個構造方法,兩個參數:
1. 一個函數指針:void (*fn)(void),指向我們具體要編寫的測試方法名;
2. 一個字符串:const char *s,屬於該測試方法的描述信息。
這個構造函數調用了另一個函數RegisterTest(),具體實現見下面。
然后看最上面定義的宏TEST(x, y),主要將其替換為TestRegisterer r##x##y(x##y, # x "." # y);其中x##y作為方法名,# x "." # y作為描述信息。這里可能有些和我一樣入門級別的人沒怎么看懂這個宏,因為不知道前后加void x##y(void);這個是干嘛用的?一開始我也沒想明白,因為不加的話就會報錯,后來通過gcc的-E選項激活宏編譯,看了下編譯期間展開成啥模樣了。這里以一個簡單的例子作為說明:假設x為test,y為flow,如果不加前后那個,那么展開后為TestRegisterer rtestflow(testflow, "test.flow"); 這明顯是個函數聲明,有兩個參數,第二個是字符串,那么第一個是什么?編譯器會認為是個函數名(實際上也是的),但這個函數前面明顯未定義,就會報找不到此函數聲明的錯誤,所以就需要在之前加上void x##y(void);聲明函數,當然光聲明不實現在鏈接時同樣報錯,所以就需要在之后加上void x##y(void)進行具體實現了,注意這里沒有逗號,也沒有具體實現的{},因為這只是宏,Google的所有測試函數是這樣寫的:
TEST(x, y) { .... // 具體實現 }
那么上面例子TEST(test, flow){ ... // 具體實現 },整體展開后就是這樣:
void testflow(void); TestRegisterer rtestflow(testflow, "test.flow"); void testflow(void) { .... // 具體實現 }
第二步:N多個具體的測試實現。
#include <string> #include <vector> #include "test.h" #define arraysize(array) (sizeof(array)/sizeof((array)[0])) #define CHECK_EQ(x, y) if((x) != (y)) { printf("test failed!\n"); system("pause"); exit(0); } struct TestFlow { const char* flow; const int num; }; static struct TestFlow tests1[] = { {"\x02\x97\xa4\xe6\xfe\x0c", 2}, {"\x05\x97\x35\xe6\xfe\xac\x04", 3}, {"\xb2\x97\xa5\xe6\x9c\x1c\x58\xaa\x97\x03", 3}, {"\x32\x97\xa5\x05\x9c\xac\xe8\xaa\x57", 3}, {"\x42\x01\xa5\x86\x0c\x56\xe8\xaa\x97\x03", 5}, }; static struct TestFlow tests2[] = { {"\x02\x97\xa4\xe6\xfe\x0c", 4}, {"\x05\x97\x35\xe6\xfe\xac\x04", 4}, {"\xb2\x97\xa5\xe6\x9c\x1c\x58\xaa\x97\x03", 7}, {"\x32\x97\xa5\x05\x9c\xac\xe8\xaa\x57", 6}, {"\x42\x01\xa5\x86\x0c\x56\xe8\xaa\x97\x03", 5}, }; int getAsciiNum(const char*); int getNonAsciiNum(const char*); TEST(TestAsciiNum, Simple) { int failed = 0; for (int i = 0; i < arraysize(tests1); i++) { const TestFlow& t = tests1[i]; int num = getAsciiNum(t.flow); if (num != t.num) { failed++; } } CHECK_EQ(failed, 0); } TEST(TestNonAsciiNum, Simple) { int failed = 0; for (int i = 0; i < arraysize(tests2); i++) { const TestFlow& t = tests2[i]; int num = getNonAsciiNum(t.flow); if (num != t.num) { failed++; } } CHECK_EQ(failed, 0); } int getAsciiNum(const char* flow) { // we assume that there's no \x00 in flow otherwise we cannot use strlen() int num = 0, i; for(i = 0; i < strlen(flow); i++) { // ASCII: 0 ~ 127 if(flow[i] >= 0 && flow[i] < 128) num++; } return num; } int getNonAsciiNum(const char* flow) { // we assume that there's no \x00 in flow otherwise we cannot use strlen() int num = 0, i; for(i = 0; i < strlen(flow); i++) { // ASCII: 0 ~ 127 if(flow[i] < 0 || flow[i] >= 128) num++; } return num; }
看上去一目了然,TEST(TestAsciiNum, Simple)和TEST(TestNonAsciiNum, Simple)就是兩個具體的測試實現了,這個例子很簡單,僅僅是為了說明問題。
第三步:具體的測試方案。
// test.cpp #include <stdio.h> #include <stdlib.h> #include "test.h" struct Test { void (*fn)(void); const char *name; }; static Test tests[10000]; static int ntests; void RegisterTest(void (*fn)(void), const char *name) { tests[ntests].fn = fn; tests[ntests++].name = name; } int main(int argc, char **argv) { for (int i = 0; i < ntests; i++) { printf("%s\n", tests[i].name); tests[i].fn(); } printf("PASS\n"); system("pause"); return 0; }
解析:
1. 結構體Test存儲具體的測試實現,定義最多能有10000個不同的方法測試,也就是能同時測試10000個方法。
2. ntests代表實際所測試的方法數,我這里就是2了。
3. RegisterTest()具體的實現也比較簡單,就是將實際所要測試的方法名和描述信息存儲到Test結構體數組tests中。
4. 最后就是在main中進行統一測試了,首先輸出測試方法描述信息,以便知道當前測試了哪些方法及如果有測試失敗時能及時進行排查。然后就是具體的執行測試函數了。
本例的測試結果如下:
思考:下面看下具體是如何執行的:
大家可能覺得main寫的太簡潔,一開始什么都沒調用,直接來個for循環,ntests的值初始不是0嗎?在main一開始也沒顯式的調用RegisterTest()將測試方法加進去啊,怎么一進入main,ntests就變成2了?
大家要記住:所有的測試具體實現都是在TEST這個宏里面,而宏是在編譯期間就開始展開了。以 TEST(TestAsciiNum, Simple){ ... }為例,具體的執行過程如下:
編譯期間:
TEST(TestAsciiNum, Simple)展開為:
void TestAsciiNumSimple(void); TestRegisterer rTestAsciiNumSimple(TestAsciiNumSimple, "TestAsciiNum.Simple"); void TestAsciiNumSimple(void) { int failed = 0; for (int i = 0; i < arraysize(tests1); i++) { const TestFlow& t = tests1[i]; int num = getAsciiNum(t.flow); if (num != t.num) { failed++; } } CHECK_EQ(failed, 0); }
然后就觸發調用了TestRegisterer的構造方法從而開始執行RegisterTest(TestAsciiNumSimple, "TestAsciiNum.Simple")方法,將TestAsciiNumSimple方法名和描述信息"TestAsciiNum.Simple"加入到結構體數組tests中,這時ntests增為1,同理另一個宏TEST(TestNonAsciiNum, Simple)展開后也將TestAsciiNonNumSimple方法名和描述信息"TestNonAsciiNum.Simple"加入到結構體數組tests中,這時ntests增為2,這是編譯期間做的事。
運行期間:
從main開始,執行for循環,先后執行了具體的測試實現方法TestAsciiNumSimple()和TestAsciiNonNumSimple()從而完成測試。
用一個圖來說明更加清晰(圖畫的不太好,望見諒~~~)