iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >MySQL创建高性能索引
  • 466
分享到

MySQL创建高性能索引

MySQL创建高性能索引 2017-12-29 21:12:26 466人浏览 才女
摘要

参考《高性能Mysql》第3版 1 索引基础 1.1 索引作用 在mysql中,查找数据时先在索引中找到对应的值,然后根据匹配的索引记录找到对应的数据行,假如要运行下面查询语句: SELECT * FROM USER WHER

MySQL创建高性能索引

参考《高性能Mysql》第3版

1 索引基础

1.1 索引作用

mysql中,查找数据时先在索引中找到对应的值,然后根据匹配的索引记录找到对应的数据行,假如要运行下面查询语句:

SELECT	* FROM  USER  WHERE uid = 5;

如果在uid在建有索引,则Mysql将使用该索引先找到uid为5的行,也就是说MySQL先在索引上按值进行查找,然后返回所有包含该值的数据行。

1.2 MySQL索引常用数据结构

MySQL索引是在存储引擎层面实现的,不是在服务器实现的。所以,没有统一的索引标准:不同存储引擎的索引工作方式不一样。

1.2.1 B-Tree

大多数的MySQL引擎都支持这种索引B-Tree,即时多个存储引擎支持同一种类型的索引,其底层实现也可能不同。比如InnoDB使用的是B+Tree。
存储引擎以不同的方式实现B-Tree,性能也各有不同,各有优势。如,MyISAM使用前缀压缩技术是的索引更小,当InnoDB则按照原数据格式进行存储,MyISAMy索引通过数据的物理位置引用被索引的行,而InnoDB根据组件应用被索引的行。
B-Tree所有值都是顺序存储的,并且每一个叶子页到根的距离相同。如下图大致反应了InnoDB索引是如何工作的,MyISAM使用的结构有所不同。但基本实现是类似的。

实例图说明
每个节点占用一个磁盘块,一个节点上有两个升序排序的关键字和三个指向子树根节点的指针,指针存储的是子节点所在磁盘块的地址。两个关键词划分成的三个范围域对应三个指针指向的子树的数据的范围域。以根节点为例,关键字为 16 和 34,P1 指针指向的子树的数据范围为小于 16,P2 指针指向的子树的数据范围为 16~34,P3 指针指向的子树的数据范围为大于 34。 查找关键字过程:

  1. 根据根节点找到磁盘块 1,读入内存。【磁盘 I/O 操作第 1 次】
  2. 比较关键字 28 在区间(16,34),找到磁盘块 1 的指针 P2。
  3. 根据 P2 指针找到磁盘块 3,读入内存。【磁盘 I/O 操作第 2 次】
  4. 比较关键字 28 在区间(25,31),找到磁盘块 3 的指针 P2。
  5. 根据 P2 指针找到磁盘块 8,读入内存。【磁盘 I/O 操作第 3 次】
  6. 在磁盘块 8 中的关键字列表中找到关键字 28。 
    缺点
  7. 每个节点都有key,同时也包含data,而每个页存储空间是有限的,如果data比较大的话会导致每个节点存储的key数量变小;
  8. 当存储的数据量很大的时候会导致深度较大,增大查询时磁盘io次数,进而影响查询性能。

1.2.2 B+Tree索引

B+树是对B树的变种。与B树区别:B+树只在叶子节点存储数据,非叶子节点只存储key值及指针。
在B+树上有两个指针,一个指向根叶子节点,另一个指向关键字最小的叶子节点,而且所有叶子节点(即数据节点)之间是一种链式环结构,因此可以对B+树进行两种查找运算:一种是对于组件的范围查找,另一种是从根节点开始,进行随机查找。
B*树与B+数类似,区别在于B*数非叶子节点之间也有链式环结构。

1.2.2 Hash索引

哈希索引基于哈希表实现,只有精准匹配索引所有列的查询才有效。对于每一行数据,存储引擎都会对所有的索引列计算一个哈希码(hash code),哈希码是一个较小的值,并且不同键值的行计算出来的哈希码也不一样。哈希索引将所有的哈希码存储在索引中,同时在哈希表中保存指向每个数据行的指针。
在MySQL中只有Memory默认索引类型就是使用的哈希索引,memory也支持B-Tree索引。同时,Memory引擎支持非唯一哈希索引,如果多个列的哈希值相同,索引会以链表的方式存放多个指针相同一个哈希条目中。类似HashMap

优点
索引自身只需要存储对应的哈希值,所以索引的结构十分紧凑,哈希所以查找的速度非常快。
缺点

  1. 利用hash存储的话需要将所有的数据文件添加到内存,比较耗费内存空间;
  2. 哈希索引数据并不是按顺序存储的,所以无法用于排序;
  3. 如果所有的查询都是等值查询,那么hash确实很快,但是在企业或者实际工作环境中范围查找的数据更多,而不是等值查询,因此hash就不太适合了;
  4. 如果哈希冲突很多的话,索引维护操作的代价也会很高,这也是HashMap后期通过增加红黑树解决Hash冲突的问题;

2 高性能索引策略

2.1 聚簇索引与非聚簇索引

聚簇索引
不是单独的索引类型,而是一种数据存储方式,在InnoDB存储引擎中聚簇索引实际在同一个结构中保存了键值和数据行。当表中有聚簇索引时,它的数据行实际上存放在索引的叶子页中。因为无法同时把数据行存放在不同的地方,所以一个表中只能有一个聚簇索引(索引覆盖可以模拟出多个聚簇索引的情况)。

聚簇索引优点

  1. 可以把相关数据保存在一起;
  2. 数据访问更快,因为索引和数据保存在同一个树中;
  3. 使用覆盖索引扫描的查询可以直接使用页节点中的主键值;

缺点

  1. 聚簇数据最大限度地提高了IO密集型应用的性能,如果数据全部在内存,那么聚簇索引就没有什么优势;
  2. 插入速度严重依赖于插入顺序,按照主键的顺序插入是最快的方式;
  3. 更新聚簇索引列的代价很高,因为会强制将每个被更新的行移动到新的位置;
  4. 基于聚簇索引的表在插入新行,或者主键被更新导致需要移动行的时候,可能面临页分裂的问题;
  5. 聚簇索引可能导致全表扫描变慢,尤其是行比较稀疏,或者由于页分裂导致数据存储不连续的时候;

非聚簇索引
数据文件跟索引文件分开存放

2.2 前缀索引

有时候需要索引很长的字符串,这会让索引变的大且慢,通常情况下可以使用某个列开始的部分字符串,这样大大的节约索引空间,从而提高索引效率,但这会降低索引的选择性,索引的选择性是指:不重复的索引值(也称为基数cardinality)和数据表记录总数的比值,范围从1/#T到1之间。索引的选择性越高则查询效率越高,因为选择性更高的索引可以让mysql在查找的时候过滤掉更多的行。
一般情况下某个列前缀的选择性也是足够高的,足以满足查询的性能,但是对应BLOB,TEXT,VARCHAR类型的列,必须要使用前缀索引,因为mysql不允许索引这些列的完整长度,使用该方法的诀窍在于要选择足够长的前缀以保证较高的选择性,通过又不能太长。
举例
表结构及数据MySQL官网或GitHub下载。
city Table Columns

字段名 含义
city_id 城市主键ID
city 城市名
country_id 国家ID
last_update: 创建或最近更新时间
--计算完整列的选择性
select count(distinct left(city,3))/count(*) as sel3,
    count(distinct left(city,4))/count(*) as sel4,
    count(distinct left(city,5))/count(*) as sel5,
    count(distinct left(city,6))/count(*) as sel6,
    count(distinct left(city,7))/count(*) as sel7,
    count(distinct left(city,8))/count(*) as sel8 
from citydemo;

可以看到当前缀长度到达7之后,再增加前缀长度,选择性提升的幅度已经很小了。由此最佳创建前缀索引长度为7。

2.3 回表

要理解回表需要先了解聚族索引和普通索引。聚族索引即建表时设置的主键索引,如果没有设置MySQL自动将第一个非空唯一值作为索引,如果还是没有InnoDB会创建一个隐藏的row-id作为索引(oracle数据库row-id显式展示,可以用于分页);普通索引就是给普通列创建的索引。普通列索引在叶子节点中存储的并不是整行数据而是主键,当按普通索引查找时会先在B+树中查找该列的主键,然后根据主键所在的B+树中查找改行数据,这就是回表。

2.4 覆盖索引

覆盖索引在InnoDB中特别有用。MySQL中可以使用索引直接获取列的数据,如果索引的叶子节点中已经包含要查询的数据,那么就没必要再回表查询了,如果一个索引包含(覆盖)所有需要查询的字段的值,那么该索引就是覆盖索引。简单的说:不回表直接通过一次索引查找到列的数据就叫覆盖索引。
表信息

CREATE TABLE `t_user` (
  `uid` int(11) NOT NULL AUTO_INCREMENT,
  `uname` varchar(255) DEFAULT NULL,
  `age` int(11) DEFAULT NULL,
  `update_time` datetime DEFAULT NULL,
  PRIMARY KEY (`uid`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4;

举例

--将uid设置成主键索引后通过下面的SQL查询 在explain的Extra列可以看到“Using index”
explain select uid from t_user where uid = 1;

具体参数含义可以参考另一个文章《MySQL执行计划Explain参数详解》

覆盖索引在组合索引中用的比较多,举例

explain select age,uname from t_user where age = 10 ;   

当不建立组合索引时,会进行回表查询

设置组合索引后再次查询

create index index_user on t_user(age,uname);

2.5 索引匹配方式

2.5.1 最左匹配

在使用组合索引中,比如设置(age,name)为组合索引,单独使用组合索引中最左列是可以匹配索引的,如果不使用最左列则不走索引。例如下面SQL

--走索引
explain select * from t_user where age=10 and uname="zhang";

下面的SQL不走索引

explain select * from t_user where  uname="zhang";

2.5.2 匹配列前缀

可以匹配某一列的值的开头部分,比如like "abc%"。

2.5.3 匹配范围值

可以查找某一个范围的数据。

explain select * from t_user where age>18;

2.5.4 精确匹配某一列并范围匹配另外一列

可以查询第一列的全部和第二列的部分

explain select * from t_user where age=18 and uname like "zhang%";

2.5.5 只访问索引的查询

查询的时候只需要访问索引,不需要访问数据行,本质上就是覆盖索引。

 explain select age,uname,update_time from t_user 
            where age=18 and uname= "zhang" and update_time="123";

3 索引优化最佳实践

1. 当使用索引列进行查询的时候尽量不要使用表达式,把计算放到业务层而不是数据库层。

--推荐
select uid,age,uname from t_user where uid=1;

--不推荐
select uid,age,uname from t_user where uid+9=10;

2. 尽量使用主键查询,而不是其他索引,因为主键查询不会触发回表查询

3. 使用前缀索引
参考2.2 前缀索引
4. 使用索引扫描排序
mysql有两种方式可以生成有序的结果:通过排序操作或者按索引顺序扫描,如果explain出来的type列的值为index,则说明mysql使用了索引扫描来做排序。
扫描索引本身是很快的,因为只需要从一条索引记录移动到紧接着的下一条记录。但如果索引不能覆盖查询所需的全部列,那么就不得不每扫描一条索引记录就得回表查询一次对应的行,这基本都是随机IO,因此按索引顺序读取数据的速度通常要比顺序地全表扫描慢。
mysql可以使用同一个索引即满足排序,又用于查找行,如果可能的话,设计索引时应该尽可能地同时满足这两种任务。
只有当索引的列顺序和order by子句的顺序完全一致,并且所有列的排序方式都一样时,mysql才能够使用索引来对结果进行排序,如果查询需要关联多张表,则只有当orderby子句引用的字段全部为第一张表时,才能使用索引做排序。order by子句和查找型查询的限制是一样的,需要满足索引的最左前缀的要求,否则,mysql都需要执行顺序操作,而无法利用索引排序。
举例
表结构及数据MySQL官网或gitHub下载。

CREATE TABLE `rental` (
  `rental_id` int(11) NOT NULL AUTO_INCREMENT,
  `rental_date` datetime NOT NULL,
  `inventory_id` mediumint(8) unsigned NOT NULL,
  `customer_id` smallint(5) unsigned NOT NULL,
  `return_date` datetime DEFAULT NULL,
  `staff_id` tinyint(3) unsigned NOT NULL,
  `last_update` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
  PRIMARY KEY (`rental_id`),
  UNIQUE KEY `rental_date` (`rental_date`,`inventory_id`,`customer_id`),
  KEY `idx_fk_inventory_id` (`inventory_id`),
  KEY `idx_fk_customer_id` (`customer_id`),
  KEY `idx_fk_staff_id` (`staff_id`),
  CONSTRAINT `fk_rental_customer` FOREIGN KEY (`customer_id`) REFERENCES `customer` (`customer_id`) ON UPDATE CASCADE,
  CONSTRAINT `fk_rental_inventory` FOREIGN KEY (`inventory_id`) REFERENCES `inventory` (`inventory_id`) ON UPDATE CASCADE,
  CONSTRAINT `fk_rental_staff` FOREIGN KEY (`staff_id`) REFERENCES `staff` (`staff_id`) ON UPDATE CASCADE
) ENGINE=InnoDB AUTO_INCREMENT=16050 DEFAULT CHARSET=utf8mb4;

rental表在rental_date,inventory_id,customer_id上有rental_date的索引。使用rental_date索引为下面的查询做排序

--该查询为索引的第一列提供了常量条件,而使用第二列进行排序,将两个列组合在一起,就形成了索引的最左前缀
explain select rental_id,staff_id from rental 
where rental_date="2005-05-25" order by inventory_id desc

--下面的查询不会利用索引
explain select rental_id,staff_id from rental 
where rental_date>"2005-05-25" order by rental_date,inventory_id

5. union all,in,or都能够使用索引,但是推荐使用in

explain select * from actor where actor_id = 1 uNIOn all select * from actor where actor_id = 2;
explain select * from actor where actor_id in (1,2);
explain select * from actor where actor_id = 1 or actor_id =2;

6. 范围列可以用到索引
范围条件是:<、<=、>、>=、between。范围列可以用到索引,但是范围列后面的列无法用到索引,索引最多用于一个范围列。

7. 更新十分频繁,数据区分度不高的字段上不宜建立索引

  • 更新会变更B+树,更新频繁的字段建议索引会大大降低数据库性能;
  • 类似于性别这类区分不大的属性,建立索引是没有意义的,不能有效的过滤数据;
  • 一般区分度在80%以上的时候就可以建立索引,区分度可以使用 count(distinct(列名))/count(*) 来计算;

8. 创建索引的列,不允许为null,可能会得到不符合预期的结果

9.当需要进行表连接的时候,最好不要超过三张表,如果需要join的字段,数据类型必须一致

10. 能使用limit的时候尽量使用limit

11. 单表索引建议控制在5个以内

12. 单索引字段数不允许超过5个(组合索引)

13. 创建索引的时候应该避免以下错误概念

  • 索引越多越好
  • 过早优化,在不了解系统的情况下进行优化

4 索引监控

show status like "Handler_read%";

参数 说明
Handler_read_first 读取索引第一个条目的次数
Handler_read_key 通过index获取数据的次数
Handler_read_last 读取索引最后一个条目的次数
Handler_read_next 通过索引读取下一条数据的次数
Handler_read_prev 通过索引读取上一条数据的次数
Handler_read_rnd 从固定位置读取数据的次数
Handler_read_rnd_next 从数据节点读取下一条数据的次数

原文地址:https://www.cnblogs.com/dooor/arcHive/2022/04/10/mysql.html

您可能感兴趣的文档:

--结束END--

本文标题: MySQL创建高性能索引

本文链接: https://www.lsjlt.com/news/9230.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • MySQL创建高性能索引
    参考《高性能MySQL》第3版 1 索引基础 1.1 索引作用 在MySQL中,查找数据时先在索引中找到对应的值,然后根据匹配的索引记录找到对应的数据行,假如要运行下面查询语句: SELECT * FROM USER WHER...
    99+
    2017-12-29
    MySQL创建高性能索引
  • 为MySQL创建高性能索引
    目录1 索引基础1.1 索引作用1.2 MySQL索引常用数据结构1.2.1 B-Tree1.2.2 B+Tree索引1.2.3 Hash索引2 高性能索引策略2.1 聚簇索引与非聚...
    99+
    2022-11-13
  • 怎么为MySQL创建高性能索引
    这篇“怎么为MySQL创建高性能索引”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“怎么为MySQL创建高性能索引”文章吧。1...
    99+
    2023-06-29
  • 如何为MySQL创建高性能索引
    今天小编给大家分享一下如何为MySQL创建高性能索引的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解...
    99+
    2023-05-25
    mysql
  • MySQL创建高性能索引的全步骤
    一、索引基础 1. 索引的类型 1.1 B-Tree 索引 大多数MySQL存储引擎默认使用的是B+树的索引,不同的存储引擎用不同的方式使用B+树索引,MyISAM使用前缀压缩技术使得索引更小,但是InnoDB...
    99+
    2022-05-16
    mysql高性能索引 mysql 添加索引 mysql 性能
  • mysql创建索引
    mysql创建索引?这个问题可能是我们日常学习或工作经常见到的。希望通过这个问题能让你收获颇深。下面是小编给大家带来的参考内容,让我们一起来看看吧!分为五种索引方式:1.添加PRIMARY KEY(主键索引...
    99+
    2022-10-18
  • mysql视图能不能创建索引
    这篇文章主要介绍“mysql视图能不能创建索引”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“mysql视图能不能创建索引”文章能帮助大家解决问题。 ...
    99+
    2022-10-19
  • MySQL高性能索引策略
    前缀索引和索引选择性 有时候需要索引很长的字符,这会让索引变得大且慢。一个策略是前面提到的模拟哈希索引。 通常可以索引开始的部分字符,这样可以大大解约索引空间,提高索引效率。但这样会降低索引的选择性。 索引的选择性:不重复的索引值(也成...
    99+
    2021-10-14
    MySQL高性能索引策略
  • MySql索引和索引创建策略
    目录1、B+树索引1.1、聚集索引/聚簇索引1.2、辅助索引/二级索引1.3、联合索引/复合索引1.3.1、什么是复合索引1.3.2、最左原则1.3.3、联合索引的查询优化2、哈希索引2.1、查看哈希索引的命中率等信息3...
    99+
    2022-08-22
  • mysql 创建索引语句
    一、创建索引 PRIMARYKEY(主键索引) mysql > ALTERTABLE`table_name`ADDPRIMARYKEY (`column`) 2.UNIQUE(唯一索引) mysql ...
    99+
    2023-08-31
    mysql 数据库 java 面试 开发语言
  • mysql如何创建索引
    使用CREATE INDEX创建索引语法:CREATE [UNIQUE] INDEX index_name ONtb_name (col_name [(length)] ...
    99+
    2022-10-13
  • MySQL 主键、索引创建
    创建测试表create table t1.t (a int,b varchar(200)); -- 添加主键、索引alter table t1.t add primary key (a);alte...
    99+
    2022-10-18
  • mysql 如何创建索引
    本文将介绍mysql 如何创建索引,需要的朋友可以参考下 添加PRIMARY KEY(主键索引) mysql>ALTER TABLE `table_name` ADD PRIMARY KEY ( `column` ) 2.添加UNIQUE...
    99+
    2023-09-01
    mysql 数据库 sql
  • MYSQL创建联合索引
    在创建表的时候即指定联合索引,例如 -- 如果存在表,则删除DROP TABLE IF EXISTS core_fund_shares -- 创建表CREATE TABLE `core_fund_shares` ( `fund_code`...
    99+
    2023-08-30
    mysql 数据库
  • MySQL创建组合索引
    大家都知道索引是用来优化的主要因素,对于少量数据索引的影响并不大,对于几十万或百万级别以上数据的时候,单列索引的性能也不是很理想,组合索引可以大大的减少开销。 一、创建组合索引的方法 1、sql语句: ALTER TABLE `table_...
    99+
    2023-08-31
    mysql创建组合索引 mysql组合索引
  • MySQL(73)MySQL创建索引(CREATE INDEX)
    MySQL创建索引(CREATE INDEX) 创建索引是指在某个表的一列或多列上建立一个索引,可以提高对表的访问速度。创建索引对 MySQL 数据库的高效运行来说是很重要的。 基本语法 MySQL 提供了三种创建索引的方法: 1) 使用 ...
    99+
    2023-09-07
    数据库 sql mysql
  • 如何创建高效索引
    索引创建指南:1、频繁在where 从句中出现2、频繁在join关联字段中3、选择具有高选择性的键4、别在具有很少的不同值的键上使用B-tree索引。这类键或表达式经常具有较差选择性,所以不会是性...
    99+
    2022-10-18
  • mysql中如何创建索引
    这篇文章主要介绍mysql中如何创建索引,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!在执行CREATE TABLE语句时可以创建索引,也可以单独用CREATE INDEX或ALTER TABLE来为表增加索引。1、...
    99+
    2023-06-15
  • mysql中一个表中能创建几个索引
    这篇文章给大家分享的是有关mysql中一个表中能创建几个索引的内容。小编觉得挺实用的,因此分享给大家做个参考。一起跟随小编过来看看吧。mysql中一个表可以有多个唯一索引。如果能确定某个数据列只包含彼此各不...
    99+
    2022-10-18
  • MySQL中怎么实现高性能索引
    本篇文章为大家展示了MySQL中怎么实现高性能索引,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。什么是索引索引又可以称为键(key)是存储引擎用于快速找到记录的一种...
    99+
    2022-10-18
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作