Elasticsearch 提供的首個近似聚合是 cardinality 度量。它提供一個字段的基數,
即該字段的 distinct 或者 unique 值的數目。它是基於 HLL 算法的。HLL 會先對
我們的輸入作哈希運算,然后根據哈希運算的結果中的 bits 做概率估算從而得到
基數。其特點是:可配置的精度,用來控制內存的使用(更精確 = 更多內存);
小的數據集精度是非常高的;我們可以通過配置參數,來設置去重需要的固定內
存使用量。無論數千還是數十億的唯一值,內存使用量只與你配置的精確度相關。