广告
返回顶部
首页 > 资讯 > 数据库 >Mysql性能优化:为什么你的count(*)这么慢?
  • 962
分享到

Mysql性能优化:为什么你的count(*)这么慢?

Mysql性能优化:为什么你的count(*)这么慢? 2017-03-10 12:03:11 962人浏览 猪猪侠
摘要

导读 在开发中一定会用到统计一张表的行数,比如一个交易系统,老板会让你每天生成一个报表,这些统计信息少不了 sql 中的count函数。 但是随着记录越来越多,查询的速度会越来越慢,为什么会这样呢?Mysql内部到底是怎么处理的

Mysql性能优化:为什么你的count(*)这么慢?

导读

  • 开发中一定会用到统计一张表的行数,比如一个交易系统,老板会让你每天生成一个报表,这些统计信息少不了 sql 中的count函数。
  • 但是随着记录越来越多,查询的速度会越来越慢,为什么会这样呢?Mysql内部到底是怎么处理的?
  • 今天这篇文章将从mysql内部对于count函数是怎样处理的?
  • 本文首发于作者微信公众号【码猿技术专栏】Mysql性能优化:为什么你的count(*)这么慢?,原创不易,喜欢的请支持一下,谢谢!!!

count的实现方式

  • 在Mysql中的不同的存储引擎对count函数有不同的实现方式。
  • MyISAM引擎把一个表的总行数存在了磁盘上,因此执行count(*)的时候会直接返回这个数,效率很高(没有where查询条件)。
  • InnoDB引擎并没有直接将总数存在磁盘上,在执行count(*)函数的时候需要一行一行的将数据读出来,然后累计总数。

为什么InnoDB不将总数存起来?

  • 说到InnoDB相信读者总会想到其支持事务的特性,事务具有隔离性,如果将总数存起来,怎么保证各个事务之间的总数的一致性呢?不明白的看图

  • 事务A事务B中的count(*)的执行结果是不同的,因此InnoDB引擎在每个事务中返回多少行是不确定的,只能一行一行的读出来用来判断总数。

如何提升count效率

  • InnoDB对于如何提升count(*)的查询效率,网上有多种解决办法,这里主要介绍三种,并分析可行性。

show table status

  • show table status这个命令能够很快的查询出数据库中每个表的行数,但是真的能够替代count(*)吗?
  • 答案是不能。原因很简单,这个命令统计出来的值是一个「估值」,因此是不准确的,官方文档说误差大概在40%-50%
  • 因此这种方法直接pass,不准确还用它干嘛。

缓存系统存储总数

  • 这种方法也是最容易想到的,增加一行就+1,删除一行就-1,并且缓存系统读取也是很快,既简单又方便的为什么不用?

  • 缓存系统和Mysql是两个系统,比如RedisMysql这两个是典型的比较。两个系统最难的就是在高并发下无法保证数据的一致性。  

  • 通过上面两张图,无论是redis计数+1还是insert into user先执行,最终都会导致数据在逻辑上的不一致。第一张图会出现redis计数少了,第二张图虽然计数正确了但是并没有查询出插入的那一行数据。

  • 并发系统里面,我们是无法精确控制不同线程的执行时刻的,因为存在图中的这种操作序列,所以,我们说即使Redis正常工作,这个计数值还是逻辑上不精确的。

数据库保存计数

  • 通过缓存系统保存的分析得知了使用缓存无法保证数据在逻辑上的一致性,因此我们想到了直接使用数据库来保存,有了「事务」的支持,也就保证了数据的一致性了。

  • 如何使用呢?很简单,直接将计数保存在一张表中(table_name,total)

  • 至于执行的逻辑只需要将缓存系统中redis计数+1改成total字段+1即可,如下图: 

  • 由于在同一个事务中,保证了数据在逻辑上的一致性。

不同count的用法

  • count()是一个聚合函数,对于返回的结果集,一行行地判断,如果count函数的参数不是NULL,累计值就加1,否则不加。最后返回累计值。
  • count的用法有多种,分别是count(*)count(字段)count(1)count(主键id)。那么多种用法,到底有什么差别呢?当然,「前提是没有where条件语句」
  • count(id):InnoDB引擎会遍历整张表,把每一行的id值都取出来,返回给server层。server层拿到id后,判断是不可能为空的,就按行累加。
  • count(1):InnoDB引擎遍历整张表,但不取值。server层对于返回的每一行,放一个数字1进去,判断是不可能为空的,按行累加。
  • count(字段)count(*):不会把全部字段取出来,而是专门做了优化,不取值。count(*)肯定不是null,按行累加。
    • 如果这个“字段”是定义为not null的话,一行行地从记录里面读出这个字段,判断不能为null,按行累加;
    • 如果这个字段定义允许为null,那么执行的时候,判断到有可能是null,还要把值取出来再判断一下,不是null才累加。
  • 所以结论很简单:「按照效率排序的话,count(字段)<count(主键id)<count(1)count(*),所以建议读者,尽量使用count(*)。」
  • 「注意」:这里肯定有人会问,count(id)不是走的索引吗,为什么查询效率和其他的差不多呢?陈某在这里解释一下,虽然走的索引,但是还是要一行一行的扫描才能统计出来总数。

总结

  • MyISAM表虽然count(*)很快,但是不支持事务;
  • show table status命令虽然返回很快,但是不准确;
  • InnoDB直接count(*)会遍历全表(没有where条件),虽然结果准确,但会导致性能问题。
  • 缓存系统的存储计数虽然简单效率高,但是无法保证数据的一致性。
  • 数据库保存计数很简单,也能保证数据的一致性,建议使用。
  • 「思考题,读者留言区讨论」:在系统高并发的情况下,使用数据库保存计数,是先更新计数+1,还是先插入数据。即是先update total+=1还是先insert into

 

您可能感兴趣的文档:

--结束END--

本文标题: Mysql性能优化:为什么你的count(*)这么慢?

本文链接: https://www.lsjlt.com/news/5307.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Mysql性能优化:为什么你的count(*)这么慢?
    导读 在开发中一定会用到统计一张表的行数,比如一个交易系统,老板会让你每天生成一个报表,这些统计信息少不了 sql 中的count函数。 但是随着记录越来越多,查询的速度会越来越慢,为什么会这样呢?Mysql内部到底是怎么处理的...
    99+
    2017-03-10
    Mysql性能优化:为什么你的count(*)这么慢?
  • 一文解答为什么MySQL的count()方法这么慢
    目录前言count()的原理各种count()方法的原理允许粗略估计行数的场景必须精确估计行数的场景总结前言 mysql用count方法查全表数据,在不同的存储引擎里实现不同,myisam有专门字段记录全表的行数,直接读...
    99+
    2022-07-01
    MySQL的count()方法 MySQL count
  • Mysql性能优化:为什么要用覆盖索引?
    导读   相信读者看过很多MYSQL索引优化的文章,其中有很多优化的方法,比如最佳左前缀,覆盖索引等方法,但是你真正理解为什么要使用最佳左前缀,为什么使用覆盖索引会提升查询的效率吗? 本篇文章将从MYSQL内部结构上讲一下...
    99+
    2018-09-16
    Mysql性能优化:为什么要用覆盖索引?
  • linux中为什么要性能优化
    这篇文章主要介绍了linux中为什么要性能优化,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。为什么要性能优化也许是想要支持更高的吞吐量,想要更小的延迟,或者提高资源的利用率等...
    99+
    2023-06-15
  • MySQL性能优化的方法是什么
    本篇内容主要讲解“MySQL性能优化的方法是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“MySQL性能优化的方法是什么”吧!一、优化思路数据查询慢,不代表...
    99+
    2022-10-19
  • MySQL的优化器对于count(*)的处理方式是什么
    今天就跟大家聊聊有关MySQL的优化器对于count(*)的处理方式是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获...
    99+
    2022-10-19
  • mysql慢查询优化的方法是什么
    MySQL慢查询优化的方法有以下几种:1. 使用索引:索引可以大大提高查询的速度。需要根据查询语句的特点选择合适的列进行索引,避免全...
    99+
    2023-08-31
    mysql
  • Mysql性能优化:什么是索引下推?
    导读 本文章始发于本人公众号:码猿技术专栏,原创不易,谢谢关注推荐。 索引下推(index condition pushdown )简称ICP,在Mysql5.6的版本上推出,用于优化查询。 在不使用ICP的情况下,在使用...
    99+
    2018-12-31
    Mysql性能优化:什么是索引下推?
  • MySQL数据库的性能优化方法是什么
    本篇内容介绍了“MySQL数据库的性能优化方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、MySQL数据库的优化目标、基本原则:...
    99+
    2023-07-06
  • 怎么进行MySQL性能优化中的索引优化
    本篇文章为大家展示了怎么进行MySQL性能优化中的索引优化,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。大家都知道索引对于数据访问的性能有非常关键的作用,都知道索引...
    99+
    2022-10-19
  • MySQL性能优化的21条经验分别是什么
    这篇文章给大家介绍MySQL性能优化的21条经验分别是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。 今天,数据库的操作越来越成为整个应用的性能瓶颈了,这点对于Web应用尤其明显...
    99+
    2022-10-18
  • MySQL定位并优化慢查询sql的方法是什么
    本篇内容介绍了“MySQL定位并优化慢查询sql的方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1.如何定位并优化慢查询sql  ...
    99+
    2023-06-22
  • 怎么分析MySQL性能优化的参数
    怎么分析MySQL性能优化的参数,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。MySQL的优化我分为两个部分,一是服务器物理硬...
    99+
    2022-10-19
  • MYSQL中1000万条数据你是怎么查询的,查询非常慢怎么优化
    select count(*) from user_login_log;select * from user_login_log limit 10000,100;select * from user_login...
    99+
    2023-09-04
    mysql 数据库 sql
  • Java中的Kafka为什么性能这么快及4大核心详析
    目录1、页缓存技术2、磁盘顺序写3、零拷贝4、分区分段+索引 Kafka的性能快这是大厂Java面试经常问的一个话题,下面我就重点讲解Kafka为什么性能这么快的4大核心原因 1、页...
    99+
    2022-11-13
  • Nginx性能优化的方法是什么
    今天小编给大家分享一下Nginx性能优化的方法是什么的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。Nginx 性能优化1、N...
    99+
    2023-07-06
  • vue的性能优化方法有什么
    这期内容当中小编将会给大家带来有关vue的性能优化方法有什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。性能优化方法有:1、使用“v-slot:slotName”,而不...
    99+
    2022-10-19
  • Spark性能优化的基础是什么
    Spark性能优化的基础是什么,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。前言在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功...
    99+
    2023-06-03
  • react性能优化的周期函数是什么
    这篇文章主要讲解了“react性能优化的周期函数是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“react性能优化的周期函数是什么”吧! ...
    99+
    2022-10-19
  • CSS性能优化的五大工具是什么
    本文小编为大家详细介绍“CSS性能优化的五大工具是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“CSS性能优化的五大工具是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。...
    99+
    2022-10-19
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作