最近在測試實時日志檢索系統,有些服務日志流量較大,頂峰有15w/s的流量,日流有70億。如何驗證檢索數據的正確性呢?兩個方面,1、檢索結果中的數據格式檢驗 2、檢索結果中的數據量是否符合檢索條件
對於小流量服務的測試方案是通過http請求來構造日志數據,結合grafana對http請求數的監控來實時獲取實際產生的日志數據,然后對比日志檢索服務搜索出來的數據,通過這樣的方式來驗證檢索數據的正確性
但是對於大流量服務,因為測試環境也不支持構造如此大tps的場景。因此我們選擇了一下兩種方案:
1、樣本數據檢測。每隔一段時間汪線上的真實數據中注入測試日志數據,統計日志檢索服務搜索結果中的樣本數據,然后和實際構造的樣本數據進行數量以及格式的對比
2、參考歷史數據。假設待測服務已經上線半年以上了,已經對該服務的日志流量做了線上監控,歷史數據已知。此時我只需要對比日志檢索服務搜索出來的數據和歷史數據做對比