TPC-DS是一個面向決策支持系統的包含多維度常規應用模型的決策支持基准,它對決策支持系統的幾個普遍適用方面進行建模,包括查詢和數據維護。TPC基准測試的目的是為行業用戶提供相關、客觀的性能數據。TPC-DS使大數據系統等新興技術能夠執行基准測試。
這個基准測試有以下幾個主要特點:
- 采用星型、雪花型等多維數據模式。
- 包含7張事實表,17張緯度表,平均每張表含有18列。
- 包含99個測試用例,遵循SQL 99和SQL 2003的語法標准。
- 這個測試集包含對大數據集的統計、報表生成、聯機查詢、數據挖掘等復雜應用, 測試場景貼合商業實際
- 幾乎所有的測試案例都有很高的IO負載和CPU計算需求
TPC-DS的難點和挑戰主要有:
- 數據集規模大,例如事實表store_sales,單表超過280億行。
- 面向真實零售決策場景,SQL非常復雜:覆蓋SQL99和2003的核心部分以及OLAP標准;既包含報表類ad-hoc低延時查詢,又包含海量數據挖掘高吞吐分析查詢。
- 測試項多且維度廣:既要高性能、高可靠、高可用、高性價比,又要ETL和數據更新的ACID能力。
TPC-DS的性能衡量關鍵指標有:
- QphDS@SF:每秒的有效查詢數據量的性能指標,值越大,性能越好
- $/kQphDS@SF:反映每秒查詢數據量的性價比指標,值越小說明性價比越高
工作負載介紹:
- 測試數據加載 :主要包括: 被測系統准備、數據文件生成、測試數據庫創建、基礎表創建、數據加載、約束驗證、輔助數據結構( 如索引) 創建、表和輔助數據統計分析等。
- Power測試:用於評測數據庫對單個查詢流的處理能力。
- Throughput測試:用於測試DBMS對多個查詢流並發查詢和操作的處理能力,分為數據查詢和數據維護各兩個子步驟
SQL 特征及數量
測試模型關系