Mysql使用Java UUID作為唯一值時使用前綴索引測試 - 碼上歡樂

相關內容簡體繁體

Mysql使用Java UUID作為唯一值時使用前綴索引測試

本文轉載自查看原文 2019-07-24 20:59 681 Java/ java/ MySql/ mysql

Mysql可以使用字符串前綴作為索引以節約空間。

下面我們以 Java的UUID 生成的 32位(移除UUID中的中划線)字符串來做一下測試。

表結構：

CREATE TABLE `test_uuid` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`uuid` varchar(36) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT DEFAULT CHARSET=utf8

UUID生成的方式(不考慮replaceAll的替換效率)：

UUID.randomUUID().toString().replaceAll("-", "")

查詢不同長度的前綴索引效率（索引的選擇性，即不重復的索引值）的SQL:

select 
count(DISTINCT uuid) / count(*) as total,
count(DISTINCT LEFT(uuid,5)) / count(*) as five,
count(DISTINCT LEFT(uuid,6)) / count(*) as six,
count(DISTINCT LEFT(uuid,7)) / count(*) as seven,
count(DISTINCT LEFT(uuid,8)) / count(*) as eight,
count(DISTINCT LEFT(uuid,9)) / count(*) as nine,
count(DISTINCT LEFT(uuid,10)) / count(*) as ten
from test_uuid;

下面看一下測試數據及結果：

20W數據

40W

60W

80W

100W

200W

300W

500W

1000W

2000W

隨着數據量的增多，同樣長度的前綴索引選擇性逐漸降低。

前7位在2000W數據的時候損失了 0.04，也就是說每100 條數據，會有4條與其他96條數據有重復。

前9位在2000W數據的時候損失了 0.0001 ，也就是說每10000 條數據，會有1 條與其他 9999條有重復。

前10位在2000W數據的時候選擇行依然為1 (前10位沒有任何重復的)。

大家可以算一下 26的10次方，大概是 141 萬億。

當然，以上數據我只做過一次，其他測試數據應該與本次測試數據稍有不同，但可以肯定的是：不會相差很多。

所以，當業務需要使用 uuid 作為業務唯一的key時，可以評估業務數據量，選擇合適長度的前綴索引。

前綴索引的選擇性越接近總長度索引的選擇性時，說明已經可以了。

但是，前綴索引有一些缺點：

1. Mysql 前綴索引不支持 order by 和 group by 查詢。

2 Mysql 前綴索引不能作為覆蓋索引使用。

各位大佬有問題，歡迎交流。

　　

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MySQL的前綴索引你是如何使用的 MySQL索引優化--對前綴索引使用like模糊匹配時的實際索引選擇 mysql varchar 使用唯一索引時無法區分大小寫可以使用varbinary 什么是uuid以及uuid在java中的使用什么是uuid以及uuid在java中的使用錯誤使用MySQL前綴索引導致的慢查詢在使用mongoDB 中Group時，分組字段不是唯一索引記 postgresql 創建並使用uuid作為唯一主鍵 Python使用UUID庫生成唯一ID mysql索引之一：索引基礎（B-Tree索引、哈希索引、聚簇索引、全文(Full-text)索引區別）（唯一索引、最左前綴索引、前綴索引、多列索引）

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM