首页 > 资讯 > 精选 >SQL查询优化原理实例分析

351

分享到

SQL查询优化原理实例分析

2023-07-02 08:07:05 351人浏览八月长安

摘要

今天小编给大家分享一下sql查询优化原理实例分析的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。有一张财务流水表，未分库分表，

今天小编给大家分享一下sql查询优化原理实例分析的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。

有一张财务流水表，未分库分表，目前的数据量为9555695，分页查询使用到了limit，优化之前的查询耗时16 s 938 ms (execution: 16 s 831 ms, fetching: 107 ms)，按照下文的方式调整SQL后，耗时347 ms (execution: 163 ms, fetching: 184 ms)；

操作：查询条件放到子查询中，子查询只查主键ID，然后使用子查询中确定的主键关联查询其他的属性字段；
原理：1、减少回表操作；
2、可参考《阿里巴巴Java开发手册（泰山版）》第五章-MySQL 数据库、（二）索引规约、第7条：
【推荐】利用延迟关联或者子查询优化超多分页场景。
说明： Mysql并不是挑过offeset行，而是取offset+N行，然后返回放弃前offset行，返回N行，那当offset特别大的时候，效率就非常的底下，要么控制返回的总页数，要么对超过特定阈值的页数进行SQL改写。
正例：先快速定位需要获取的id段，然后再关联：
SELECT a.* FROM 表1 a,(select id from 表1 where 条件 LIMIT 100000,20) b where a.id = b.id;

-- 优化前SQLSELECT  各种字段FROM `table_name`WHERE 各种条件LIMIT 0,10;

-- 优化后SQLSELECT  各种字段FROM `table_name` main_taleRIGHT JOIN (SELECT  子查询只查主键FROM `table_name`WHERE 各种条件LIMIT 0,10;) temp_table ON temp_table.主键 = main_table.主键

前言

首先说明一下mysql的版本：

mysql> select version();+-----------+| version() |+-----------+| 5.7.17    |+-----------+1 row in set (0.00 sec)

表结构：

mysql> desc test;+--------+---------------------+------+-----+---------+----------------+| Field  | Type                | Null | Key | Default | Extra          |+--------+---------------------+------+-----+---------+----------------+| id     | bigint(20) unsigned | NO   | PRI | NULL    | auto_increment || val    | int(10) unsigned    | NO   | MUL | 0       |                || source | int(10) unsigned    | NO   |     | 0       |                |+--------+---------------------+------+-----+---------+----------------+3 rows in set (0.00 sec)

id为自增主键，val为非唯一索引。

灌入大量数据，共500万：

mysql> select count(*) from test;+----------+| count(*) |+----------+|  5242882 |+----------+1 row in set (4.25 sec)

我们知道，当limit offset rows中的offset很大时，会出现效率问题：

mysql> select * from test where val=4 limit 300000,5;+---------+-----+--------+| id      | val | source |+---------+-----+--------+| 3327622 |   4 |      4 || 3327632 |   4 |      4 || 3327642 |   4 |      4 || 3327652 |   4 |      4 || 3327662 |   4 |      4 |+---------+-----+--------+5 rows in set (15.98 sec)

为了达到相同的目的，我们一般会改写成如下语句：

mysql> select * from test a inner join (select id from test where val=4 limit 300000,5) b on a.id=b.id;+---------+-----+--------+---------+| id      | val | source | id      |+---------+-----+--------+---------+| 3327622 |   4 |      4 | 3327622 || 3327632 |   4 |      4 | 3327632 || 3327642 |   4 |      4 | 3327642 || 3327652 |   4 |      4 | 3327652 || 3327662 |   4 |      4 | 3327662 |+---------+-----+--------+---------+5 rows in set (0.38 sec)

时间相差很明显。

为什么会出现上面的结果？我们看一下select * from test where val=4 limit 300000,5;的查询过程：

查询到索引叶子节点数据。
根据叶子节点上的主键值去聚簇索引上查询需要的全部字段值。

类似于下面这张图：

SQL查询优化原理实例分析

像上面这样，需要查询300005次索引节点，查询300005次聚簇索引的数据，最后再将结果过滤掉前300000条，取出最后5条。MySQL耗费了大量随机I/O在查询聚簇索引的数据上，而有300000次随机I/O查询到的数据是不会出现在结果集当中的。

肯定会有人问：既然一开始是利用索引的，为什么不先沿着索引叶子节点查询到最后需要的5个节点，然后再去聚簇索引中查询实际数据。这样只需要5次随机I/O，类似于下面图片的过程：

SQL查询优化原理实例分析

其实我也想问这个问题。

证实

下面我们实际操作一下来证实上述的推论：

为了证实select * from test where val=4 limit 300000,5是扫描300005个索引节点和300005个聚簇索引上的数据节点，我们需要知道MySQL有没有办法统计在一个sql中通过索引节点查询数据节点的次数。我先试了Handler_read_*系列，很遗憾没有一个变量能满足条件。

我只能通过间接的方式来证实：

InnoDB中有buffer pool。里面存有最近访问过的数据页，包括数据页和索引页。所以我们需要运行两个sql，来比较buffer pool中的数据页的数量。预测结果是运行select * from test a inner join (select id from test where val=4 limit 300000,5); 之后，buffer pool中的数据页的数量远远少于select * from test where val=4 limit 300000,5;对应的数量，因为前一个sql只访问5次数据页，而后一个sql访问300005次数据页。

select * from test where val=4 limit 300000,5

mysql> select index_name,count(*) from infORMation_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('val','primary') and TABLE_NAME like '%test%' group by index_name;Empty set (0.04 sec)

可以看出，目前buffer pool中没有关于test表的数据页。

mysql> select * from test where val=4 limit 300000,5;+---------+-----+--------+| id      | val | source |+---------+-----+--------+| 3327622 |   4 |      4 || 3327632 |   4 |      4 || 3327642 |   4 |      4 || 3327652 |   4 |      4 || 3327662 |   4 |      4 |+---------+-----+--------+5 rows in set (26.19 sec)mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('val','primary') and TABLE_NAME like '%test%' group by index_name;+------------+----------+| index_name | count(*) |+------------+----------+| PRIMARY    |     4098 || val        |      208 |+------------+----------+2 rows in set (0.04 sec)

可以看出，此时buffer pool中关于test表有4098个数据页，208个索引页。

select * from test a inner join (select id from test where val=4 limit 300000,5) ;为了防止上次试验的影响，我们需要清空buffer pool，重启mysql。

mysqladmin shutdown/usr/local/bin/mysqld_safe &

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('val','primary') and TABLE_NAME like '%test%' group by index_name;Empty set (0.03 sec)

运行sql：

mysql> select * from test a inner join (select id from test where val=4 limit 300000,5) b on a.id=b.id;+---------+-----+--------+---------+| id      | val | source | id      |+---------+-----+--------+---------+| 3327622 |   4 |      4 | 3327622 || 3327632 |   4 |      4 | 3327632 || 3327642 |   4 |      4 | 3327642 || 3327652 |   4 |      4 | 3327652 || 3327662 |   4 |      4 | 3327662 |+---------+-----+--------+---------+5 rows in set (0.09 sec)mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('val','primary') and TABLE_NAME like '%test%' group by index_name;+------------+----------+| index_name | count(*) |+------------+----------+| PRIMARY    |        5 || val        |      390 |+------------+----------+2 rows in set (0.03 sec)

我们可以看明显的看出两者的差别：第一个sql加载了4098个数据页到buffer pool，而第二个sql只加载了5个数据页到buffer pool。符合我们的预测。也证实了为什么第一个sql会慢：读取大量的无用数据行（300000），最后却抛弃掉。
而且这会造成一个问题：加载了很多热点不是很高的数据页到buffer pool，会造成buffer pool的污染，占用buffer pool的空间。遇到的问题

为了在每次重启时确保清空buffer pool，我们需要关闭innodb_buffer_pool_dump_at_shutdown和innodb_buffer_pool_load_at_startup，这两个选项能够控制数据库关闭时dump出buffer pool中的数据和在数据库开启时载入在磁盘上备份buffer pool的数据。

以上就是“SQL查询优化原理实例分析”这篇文章的所有内容，感谢各位的阅读！相信大家阅读完这篇文章都有很大的收获，小编每天都会为大家更新不同的知识，如果还想学习更多的知识，请关注编程网精选频道。

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: SQL查询优化原理实例分析

本文链接: https://www.lsjlt.com/news/340636.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

SQL查询优化原理实例分析

今天小编给大家分享一下SQL查询优化原理实例分析的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。有一张财务流水表，未分库分表，...

99+

2023-07-02
MySQL中SQL语句分析与查询优化的示例分析

这篇文章主要为大家展示了“MySQL中SQL语句分析与查询优化的示例分析”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“MySQL中SQL语句分析与查询优化的示例...

99+

2022-10-18
一次SQL查询优化原理分析(900W+数据从17s到300ms)

目录前言证实参考资料：有一张财务流水表，未分库分表，目前的数据量为9555695，分页查询使用到了limit，优化之前的查询耗时16 s 938 ms (execution: 16 s 831 ms, fetching:...

99+

2022-06-13

SQL查询优化
一次SQL查询优化原理分析（900W+数据，从17s到300ms）

有一张财务流水表，未分库分表，目前的数据量为9555695，分页查询使用到了limit，优化之前的查询耗时16 s 938 ms (execution: 16 s 831 ms, fetching: 107 ms)，按照下文的方式调整SQL...

99+

2014-07-10

一次SQL查询优化原理分析（900W+数据，从17s到300ms）
MySQL查询优化的示例分析

小编给大家分享一下MySQL查询优化的示例分析，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！一、优化的思路和原则有哪些1、优化更需要优化的查询 2、定位优化对象的性能瓶颈 3、明确优...

99+

2022-10-18
SqlServer执行计划及Sql查询优化的示例分析

SqlServer执行计划及Sql查询优化的示例分析，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。谈到优化就必然要涉及索引，就像要讲锁必然要说...

99+

2022-10-19
数据库查询优化之子查询优化的示例分析

这篇文章将为大家详细讲解有关数据库查询优化之子查询优化的示例分析，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。1. 案例取所有不为掌门人的员工，按年龄分组！selec&#...

99+

2022-10-18
JPA原生SQL分页查询逻辑的示例分析

这篇文章将为大家详细讲解有关JPA原生SQL分页查询逻辑的示例分析，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。JPA原生SQL(自定义SQL)分页查询JPA自己写SQL查询的话，分页还稍微麻烦经过测试下...

99+

2023-06-21
MySQL优化之慢查询日志实例分析

本篇内容主要讲解“MySQL优化之慢查询日志实例分析”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“MySQL优化之慢查询日志实例分析”吧!一、慢查询日志概念对于SQL和索引的优化问题，我们会使用...

99+

2023-07-02
SQL中的连接查询实例分析

这篇文章主要讲解了“SQL中的连接查询实例分析”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“SQL中的连接查询实例分析”吧！Join 连接 (SQL Join)SQL J...

99+

2023-07-02
PostgreSQL中查询优化的示例分析

小编给大家分享一下PostgreSQL中查询优化的示例分析，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！一、总体说明下面是PG源码目录(/src/backend/optimizer)中的R...

99+

2022-10-18
SQL查询优化实践

为什么要优化系统的吞吐量瓶颈往往出现在数据库的访问速度上，即随着应用程序的运行，数据库的中的数据会越来越多，处理时间会相应变慢，且数据是存放在磁盘上的，读写速度无法和内存相比如何优化设计数据库时：数据库表、字段的设计，存储引擎 ...

99+

2020-10-01

SQL查询优化实践
Java二叉树查询原理实例代码分析

这篇文章主要介绍“Java二叉树查询原理实例代码分析”，在日常操作中，相信很多人在Java二叉树查询原理实例代码分析问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Java二叉树查询原理实例代码分析”的疑惑有所...

99+

2023-07-04
MySQL查询缓存优化的示例分析

小编给大家分享一下MySQL查询缓存优化的示例分析，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！MySQL查询缓存优化1 概述2...

99+

2022-10-18
mysql中慢查询优化的示例分析

这篇文章主要介绍mysql中慢查询优化的示例分析，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！一个用户反映线上一个SQL语句执行时间慢得无法接受。SQL语句看上去很简单（本文描述中修...

99+

2022-10-18
sql分页查询如何优化

优化 SQL 分页查询的方法有很多，以下是一些常见的优化策略：1. 使用索引：为要查询的列创建合适的索引，可以大大提高查询速度。尤其...

99+

2023-09-20

sql
mysql大数据查询优化的示例分析

这篇文章给大家分享的是有关mysql大数据查询优化的示例分析的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。mysql数据量少，优化没必要，数据量大，优化少不了，不优化一个查询10...

99+

2022-10-18
LINQ to SQL动态查询举例分析

本篇内容介绍了“LINQ to SQL动态查询举例分析”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！LINQ to SQL动态查询使用LIN...

99+

2023-06-17
MySQL优化 - 性能分析与查询优化

MySQL优化 - 性能分析与查询优化优化应贯穿整个产品开发周期中，比如编写复杂SQL时查看执行计划，安装MySQL服务器时尽量合理配置(见过太多完全使用默认配置安装的情况)，根...

99+

2022-10-18
Mysql优化技巧之Limit查询的示例分析

小编给大家分享一下Mysql优化技巧之Limit查询的示例分析，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！前言在实际业务中对于分页来说是一个比较常见的业务需求。那么就会使用到limit查...

99+

2022-10-18