mysql建立高效索引分析

本文转载自查看原文 2019-08-21 14:48 662 MySQL/ 表/ 08-MySQL/ 索引

一、如何建立理想的索引？

查询频繁度
区分度
索引长度
覆盖字段

1.1区分度

假设100万用户,性别基本上男/女各为50W, 区分度就低。

1.2长度小

索引长度直接影响索引文件的大小,影响增删改的速度,并间接影响查询速度(占用内存多).

1.3区分度高，长度小

如何让区分度高，而长度小？

可以针对列中的值,从左往右截取部分,来建索引

截的越短，重复度越高，区分度越小, 索引效果越不好。
截的越长，重复度越低，区分度越高，索引效果越好，但带来的影响也越大–增删改变慢，并间影响查询速度。

所以，我们要在区分度 + 长度两者上，取得一个平衡。惯用手法：截取不同长度，并测试其区分度。
假设我们有一张表：英语4级的单词表，里面有13324条记录，我们怎么给name字段加索引呢？

如果计算区分度？
截取单词第1位的不重复数：

select count(distinct left(name,1)) from dict

总的数量：

select count(*) from dict

区分度：不重复数/总的数量，sql语句如下：

select (select count(distinct left(name,1)) from dict) / (select count(*) from dict) as rate;

然后按照这样的步骤把其他长度所对应的区分度给找出来，看一个这个图表，可以知道当长度为11的时候重复度仅仅为1%，我们可以考虑建立11位长的索引

alter table dict add index name name(11);

1.4左前缀不好区分的情况

如url列
http://www.baidu.com

http://www.web-bc.cn
列的前11个字符都是一样的,不易区分, 可以用如下2个办法来解决

1.4.1把列内容倒过来存储，这样左前缀区分度大，并建立索引

moc.udiab.www//:ptth

nc.cb-bew.www//😕/ptth

1.4.2伪hash索引效果

同时存url和url_hash列，建表如下

create table t10 (
id int primary key,
url char(60) not null default ''
);
#插入数据
insert into t10 values
(1,'http://www.baidu.com'),
(2,'http://www.sina.com'),
(3,'http://www.sohu.com.cn'),
(4,'http://www.onlinedown.net'),
(5,'http://www.gov.cn');
#修改表结构，添加urlcrc列
alter table t10 add urlcrc int unsigned not null;

在存储的时候，将url对应的crc32码一同插入到数据库中，然后按照urlcrc字段建立索引，然后查找的时候，我们在业务层中将对应的url转换为crc32进行查找，就可以利用上索引了。
因为crc的结果是32位int无符号数,因此当数据超过40亿,也会有重复,但这是值得的.(索引长度为int4个字节)

多列索引

多列索引的考虑因素—列的查询频率，列的区分度，注意一定要结合实际业务场景
以ecshop商城为例，goods表中的cat_id,brand_id,做多列索引，从区分度看,brand_id区分度更高，但从商城的实际业务业务看，顾客一般先选大分类->小分类->品牌，最终选择建立2个索引：
(1)index(cat_id,brand_id)

(2)index(cat_id,shop_price)
甚至可以再加(3)index(cat_id,brand_id,shop_price)，3个冗余索引。但(3)中的前2列和(1)中的前2列一样，所以可以再去掉(1)，建立2个索引

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 mysql高效索引之覆盖索引【mysql】mysql中单列索引、联合索引、Join联表查询建立索引和 EXPLAIN的分析使用【原】MySQL建立索引 MySQL的索引建立的过程 MySQL建立索引的原则 mysql建立索引 MYSQL 高效索引策略（完成） mysql索引及建立组合索引原则 mysql 建立索引场合及索引使用 mysql 索引优化,索引建立原则和不走索引的原因