大數據如何做驗證數據正確性


最近在測試實時日志檢索系統,有些服務日志流量較大,頂峰有15w/s的流量,日流有70億。如何驗證檢索數據的正確性呢?兩個方面,1、檢索結果中的數據格式檢驗 2、檢索結果中的數據量是否符合檢索條件

對於小流量服務的測試方案是通過http請求來構造日志數據,結合grafana對http請求數的監控來實時獲取實際產生的日志數據,然后對比日志檢索服務搜索出來的數據,通過這樣的方式來驗證檢索數據的正確性

但是對於大流量服務,因為測試環境也不支持構造如此大tps的場景。因此我們選擇了一下兩種方案:

1、樣本數據檢測。每隔一段時間汪線上的真實數據中注入測試日志數據,統計日志檢索服務搜索結果中的樣本數據,然后和實際構造的樣本數據進行數量以及格式的對比

2、參考歷史數據。假設待測服務已經上線半年以上了,已經對該服務的日志流量做了線上監控,歷史數據已知。此時我只需要對比日志檢索服務搜索出來的數據和歷史數據做對比


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM