Clickhouse處理JSON文檔


在Yandex.Metrica中,JSON由用戶作為會話參數傳輸。這個JSON有一些特殊的功能。 (盡管在大多數情況下,JSON還需要進行預處理,結果值將以處理后的格式放在不同的列中)。所有這些函數都基於對JSON的一些假設,它們盡可能少地完成工作。

有如下假設:

—字段名稱(函數參數)必須是一個常量。

—字段名稱以某種方式在JSON中正則編碼。例如:visitParamHas(’{“abc”:“def”}’,‘abc’)= 1,visitParamHas(’{“\ u0061 \ u0062 \ u0063”:“def”}’,‘abc’ )= 0

—字段在任何嵌套級別上進行搜索。如果有多個匹配的字段,則使用第一個匹配的字段。

—JSON沒有字符串外的空格字符。

visitParamHas(params, name)

檢查是否存在具有“name”名稱的字段。

visitParamExtractUInt(params, name)

從名為“name”的字段值解析UInt64。如果這是一個字符串字段,它會嘗試從字符串的開頭解析一個數字。如果該字段不存在,或者存在但不包含數字,則返回0。

visitParamExtractInt(params, name)

與Int64相同.

visitParamExtractFloat(params, name)

與Float64相同.

visitParamExtractBool(params, name)

解析一個 true/false 值. 結果是 UInt8.

visitParamExtractRaw(params, name)

返回一個域的值, 包括分隔符.

示例:

visitParamExtractRaw(’{“abc”:"\n\u0000"}’, ‘abc’) = ‘"\n\u0000"’

visitParamExtractRaw(’{“abc”:{“def”:[1,2,3]}}’, ‘abc’) = '{“def”:[1,2,3]}' visitParamExtractString(params, name)

用雙引號解析字符串。值是未轉義的。如果轉碼失敗,它將返回一個空字符串。

示例:

visitParamExtractString(’{“abc”:"\n\u0000"}’, ‘abc’) = ‘\n\0’visitParamExtractString(’{“abc”:"\u263a"}’, ‘abc’) = ‘☺’visitParamExtractString(’{“abc”:"\u263"}’, ‘abc’) = ‘‘visitParamExtractString(’{“abc”:"hello}’, ‘abc’) = ‘’

 

參考: http://www.clickhouse.com.cn/topic/5a5f64369d28dfde2ddc5e2d


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM