
系列
- 1 分鍾快速使用 Docker 上手最新版 Sentry-CLI - 創建版本
- 快速使用 Docker 上手 Sentry-CLI - 30 秒上手 Source Maps
- Sentry For React 完整接入詳解
- Sentry For Vue 完整接入詳解
- Sentry-CLI 使用詳解
- Sentry Web 性能監控 - Web Vitals
- Sentry Web 性能監控 - Metrics
- Sentry Web 性能監控 - Trends
- Sentry Web 前端監控 - 最佳實踐(官方教程)
- Sentry 后端監控 - 最佳實踐(官方教程)
- Sentry 監控 - Discover 大數據查詢分析引擎
- Sentry 監控 - Dashboards 數據可視化大屏
- Sentry 監控 - Environments 區分不同部署環境的事件數據
- Sentry 監控 - Security Policy 安全策略報告
- Sentry 監控 - Search 搜索查詢實戰
- Sentry 監控 - Alerts 告警
- Sentry 監控 - Distributed Tracing 分布式跟蹤
- Sentry 監控 - 面向全棧開發人員的分布式跟蹤 101 系列教程(一)
- Sentry 監控 - Snuba 數據中台架構簡介(Kafka+Clickhouse)
- Sentry 監控 - Snuba 數據中台架構(Data Model 簡介)
- Sentry 監控 - Snuba 數據中台架構(Query Processing 簡介)
- Sentry 官方 JavaScript SDK 簡介與調試指南
本指南將引導您完成編寫和測試 Snuba 查詢的過程。
探索 Snuba 數據模型
為了構建 Snuba 查詢,第一步是能夠知道您應該查詢哪個數據集,您應該選擇哪些實體以及每個實體的 schema 是什么。
有關數據集和實體的介紹,請參閱 Snuba 數據模型部分。
數據集可以在這個模塊中找到。每個數據集都是一個引用實體的類。
系統中的實體列表可以通過 snuba entity 命令找到:
snuba entities list
會返回如下內容:
Declared Entities:
discover
errors
events
groups
groupassignee
groupedmessage
.....
一旦我們找到了我們感興趣的實體,我們就需要了解在該實體上聲明的 schema 和 relationship。 相同的命令描述了一個實體:
snuba entities describe groupedmessage
會返回:
Entity groupedmessage
Entity schema
--------------------------------
offset UInt64
record_deleted UInt8
project_id UInt64
id UInt64
status Nullable(UInt8)
last_seen Nullable(DateTime)
first_seen Nullable(DateTime)
active_at Nullable(DateTime)
first_release_id Nullable(UInt64)
Relationships
--------------------------------
groups
--------------------------------
Destination: events
Type: LEFT
Join keys
--------------------------------
project_id = LEFT.project_id
id = LEFT.group_id
它提供列的列表及其類型以及與數據模型中定義的其他實體的關系。
准備對 Snuba 的查詢
Snuba 查詢語言稱為 SnQL。它記錄在 SnQL 查詢語言部分。所以本節不贅述。
有一個 python sdk 可用於構建 Snuba 查詢,它可以用於任何 Python 客戶端,包括 Sentry。 snuba-sdk。
查詢表示為一個 Query 對象,如:
query = Query(
dataset="discover",
match=Entity("events"),
select=[
Column("title"),
Function("uniq", [Column("event_id")], "uniq_events"),
],
groupby=[Column("title")],
where=[
Condition(Column("timestamp"), Op.GT, datetime.datetime(2021, 1, 1)),
Condition(Column("project_id"), Op.IN, Function("tuple", [1, 2, 3])),
],
limit=Limit(10),
offset=Offset(0),
granularity=Granularity(3600),
)
有關如何構建查詢的更多詳細信息,請參見 sdk 文檔。
一旦查詢對象准備就緒,它就可以發送到 Snuba。
使用 Sentry 向 Snuba 發送查詢
查詢 Snuba 時最常見的用例是通過 Sentry。本節說明如何在 Sentry 代碼庫中構建查詢並將其發送到 Snuba。
Sentry 導入了上述的 Snuba sdk。這是構建 Snuba 查詢的推薦方法。
一旦創建了 Query 對象,Sentry 提供的 Snuba client api 就可以並且應該用於將查詢發送到 Snuba。
api 在這個模塊中。 它負責緩存、重試並允許批量查詢。
該方法返回一個字典,其中包含響應中的數據和其他元數據:
{
"data": [
{
"title": "very bad",
"uniq_events": 2
}
],
"meta": [
{
"name": "title",
"type": "String"
},
{
"name": "uniq_events",
"type": "UInt64"
}
],
"timing": {
... details ...
}
}
data 部分是一個列表,每行一個字典。meta 包含響應中包含的列的列表,其數據類型由 Clickhouse 推斷。
通過 Web UI 發送測試查詢
Snuba 具有可用於發送查詢的最小 Web UI。
您可以在本地運行 Snuba,
並且可以通過 http://localhost:1218/[DATASET NAME]/snql 訪問 Web UI。

應該在 query 屬性中提供 SnQL 查詢,並且響應的結構與上一節中討論的相同。
通過 curl 發送查詢
Web UI 僅將 payload 作為 POST 發送。因此,使用 curl 或任何其他 HTTP 客戶端可以實現相同的結果。
請求和響應格式
請求格式在上面截圖中可見:
query包含字符串形式的SnQL查詢。dataset是數據集名稱(如果尚未在url中指定。debug使Snuba在響應中提供詳盡的統計信息,包括Clickhouse查詢。consistent強制Clickhouse查詢以單線程模式執行,並且如果Clickhouse表被復制,它將強制Snuba始終命中同一個節點。可以保證順序一致性,因為這是消費者默認寫入的節點。這是通過設置為in_order的負載平衡Clickhouse屬性實現的。turbo為TURBO_SAMPLE_RATE Snuba設置中定義的查詢設置采樣率。它還可以防止Snuba將FINAL模式應用於Clickhouse查詢,以防在替換后需要保證正確的結果。
Snuba 可以使用 4 個 http code 進行響應。200 表示成功的查詢,如果查詢無法正確驗證,則為 400。500 通常意味着與 Clickhouse 相關的問題(從超時到連接問題),盡管 Snuba 仍然無法提前識別一些無效查詢。Snuba 有一個內部速率限制器,所以 429 也是一個可能的返回碼。
成功查詢的響應格式與上面討論的相同。完整版本如下所示(在 debug 模式下)
{
"data": [],
"meta": [
{
"name": "title",
"type": "String"
}
],
"timing": {
"timestamp": 1621038379,
"duration_ms": 95,
"marks_ms": {
"cache_get": 1,
"cache_set": 4,
"execute": 39,
"get_configs": 0,
"prepare_query": 10,
"rate_limit": 4,
"validate_schema": 34
}
},
"stats": {
"clickhouse_table": "errors_local",
"final": false,
"referrer": "http://localhost:1218/events/snql",
"sample": null,
"project_rate": 0,
"project_concurrent": 1,
"global_rate": 0,
"global_concurrent": 1,
"consistent": false,
"result_rows": 0,
"result_cols": 1,
"query_id": "f09f3f9e1c632f395792c6a4bfe7c4fe"
},
"sql": "SELECT (title AS _snuba_title) FROM errors_local PREWHERE equals((project_id AS _snuba_project_id), 1) WHERE equals(deleted, 0) AND greaterOrEquals((timestamp AS _snuba_timestamp), toDateTime('2021-05-01T00:00:00', 'Universal')) AND less(_snuba_timestamp, toDateTime('2021-05-11T00:00:00', 'Universal')) LIMIT 1000 OFFSET 0"
}
timing 部分包含查詢的時間戳和持續時間。有趣的是,持續時間被分解為幾個階段:marks_ms。
sql 元素是 Clickhouse 查詢。
stats 字典包含以下 key
clickhouse_table是snuba在查詢處理過程中選取的表。final表示Snuba是否決定向Clickhouse發送FINAL查詢,這會迫使Clickhouse立即應用相關的合並(Merge Tree)。細節sample是應用的采樣率。project_rate是查詢時Snuba每秒收到的特定項目的請求數。project_concurrent是查詢時涉及特定項目的並發查詢數。global_rate與project_rate相同,但不專注於一個項目。global_concurrent與project_concurrent相同,但不專注於一個項目。query_id是此查詢的唯一標識符。
查詢驗證問題通常采用以下格式:
{
"error": {
"type": "invalid_query",
"message": "missing >= condition on column timestamp for entity events"
}
}
Clickhouse 錯誤將具有類似的結構。type 字段將顯示 clickhouse,該消息將包含有關異常的詳細信息。與查詢驗證錯誤相反,在 Clickhouse 錯誤的情況下,實際執行了查詢,因此存在為成功查詢描述的所有時間和統計信息。
