iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >MySQL中distinct和group by去重效率区别是什么
  • 501
分享到

MySQL中distinct和group by去重效率区别是什么

2023-07-05 08:07:25 501人浏览 八月长安
摘要

本篇内容介绍了“MySQL中distinct和group by去重效率区别是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、

本篇内容介绍了“MySQL中distinct和group by去重效率区别是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

一、distinct

distinct的作用

Mysql中,distinct关键字的主要作用就是对数据库表中一个或者多个字段重复的数据进行过滤,只返回其中的一条数据给用户,distinct只可以在select中使用

distinct的原理

distinct进行去重的主要原理是通过先对要进行去重的数据进行分组操作,然后从分组后的每组数据中去一条返回给客户端,在这个分组的过程可能会出现两种不同的情况:

distinct 依赖的字段全部包含索引:

该情况mysql直接通过操作索引对满足条件的数据进行分组,然后从分组后的每组数据中去一条数据。

distinct 依赖的字段未全部包含索引:

该情况由于索引不能满足整个去重分组的过程,所以需要用到临时表,mysql首先需要将满足条件的数据放到临时表中,然后在临时表中对该部分数据进行分组,然后从临时表中每个分组的数据中去一条数据,在临时表中进行分组的过程中不会对数据进行排序

distinct的语法:

select distinct expression[,expression…] from tables [where conditions];

在使用distinct的过程中主要注意一下几点:

在对字段进行去重的时候,要保证distinct在所有字段的最前面

如果distinct关键字后面有多个字段时,则会对多个字段进行组合去重,只有多个字段组合起来的值是相等的才会被去重

二、group by

groupby在Mysql8.0之前会进行隐式排序,导致触发filesort,sql执行效率低下,Mysql8.0开始,Mysql就删除了隐式排序

隐式排序

对于隐式排序,我们可以参考Mysql官方的解释:

MySQL :: MySQL 5.7 Reference Manual :: 8.2.1.14 ORDER BY Optimization

GROUP BY implicitly sorts by default (that is, in the absence of ASC
or DESC designators for GROUP BY columns). However, relying on
implicit GROUP BY sorting (that is, sorting in the absence of ASC or
DESC designators) or explicit sorting for GROUP BY (that is, by using
explicit ASC or DESC designators for GROUP BY columns) is deprecated.
To produce a given sort order, provide an ORDER BY clause.

大致解释一下:

GROUP BY 默认隐式排序(指在 GROUP BY 列没有 ASC 或 DESC 指示符的情况下也会进行排序)。然而,GROUPBY进行显式或隐式排序已经过时(deprecated)了,要生成给定的排序顺序,请提供 ORDER BY 子句。

所以,在Mysql8.0之前,Group by会默认根据作用字段(Groupby的后接字段)对结果进行排序。在能利用索引的情况下,Group by不需要额外进行排序操作;但当无法利用索引排序时,Mysql优化器就不得不选择通过使用临时表然后再排序的方式来实现GROUPBY了。且当结果集的大小超出系统设置临时表大小时,Mysql会将临时表数据copy到磁盘上面再进行操作,语句的执行效率会变得极低。这也是Mysql选择将此操作(隐式排序)弃用的原因。

基于上述原因,Mysql在8.0时,对此进行了优化更新:

MySQL :: MySQL 8.0 Reference Manual :: 8.2.1.16 ORDER BY Optimization

Previously (MySQL 5.7 and lower), GROUP BY sorted implicitly under
certain conditions. In MySQL 8.0, that no longer occurs, so specifying
ORDER BY NULL at the end to suppress implicit sorting (as was done
previously) is no longer necessary. However, query results may differ
from previous MySQL versions. To produce a given sort order, provide
an ORDER BY claus

大致解释一下:

从前(Mysql5.7版本之前),Group by会根据确定的条件进行隐式排序。在mysql 8.0中,已经移除了这个功能,所以不再需要通过添加order by null 来禁止隐式排序了,但是,查询结果可能与以前的 MySQL 版本不同。要生成给定顺序的结果,请按通过ORDER BY指定需要进行排序的字段。

三、distinct 和 group by 比较

在语义相同,有索引的情况下:

group by和distinct都能使用索引,效率相同。因为groupby和distinct近乎等价,distinct可以被看做是特殊的group by。

在语义相同,无索引的情况下:

distinct效率高于group by。原因是distinct 和 group by都会进行分组操作,但group
by在Mysql8.0之前会进行隐式排序,导致触发filesort,sql执行效率低下。
但从Mysql8.0开始,Mysql就删除了隐式排序,所以,此时在语义相同,无索引的情况下,groupby和distinct的执行效率也是近乎等价的。

推荐group by的原因:

group by语义更为清晰 group by可对数据进行更为复杂的一些处理 相比于distinct来说,group by的语义明确。且由于distinct关键字会对所有字段生效,在进行复合业务处理时,group by的使用灵活性更高,groupby能根据分组情况,对数据进行更为复杂的处理,例如通过having对数据进行过滤,或通过聚合函数对数据进行运算。

distinct 主要是对数据两两进行比较,需要遍历整个表

group by 是在查询时先把数据按照分组字段分组出来再查询,当数据量较大时,group by 速度要优于 distinct

“MySQL中distinct和group by去重效率区别是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

您可能感兴趣的文档:

--结束END--

本文标题: MySQL中distinct和group by去重效率区别是什么

本文链接: https://www.lsjlt.com/news/350635.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • MySQL中distinct和group by去重效率区别是什么
    本篇内容介绍了“MySQL中distinct和group by去重效率区别是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、...
    99+
    2023-07-05
  • MySQL中distinct和group by去重效率区别浅析
    目录一、distinct二、group by三、distinct 和 group by 比较总结一、distinct distinct的作用 在mysql中,distinct关键字的主要作用就是对数据库表中一个或者多个字...
    99+
    2023-03-03
    mysql distinct去重 mysql去重查询group by sql group by去重
  • MySQL中distinct和group by去重效率区别浅析
    目录一、distinct二、group by三、distinct 和 group by 比较总结一、distinct distinct的作用 在mysql中,distinct关键字的...
    99+
    2023-03-03
    mysql distinct去重 mysql去重查询group by sql group by去重
  • MySQL去重中distinct和group by的区别浅析
    今天在写业务需要对数据库重复字段进行去重时,因为是去重,首先想到的是distinct关键字。于是一小时过去了。。。。(菜鸟一个,大家轻点骂) 我把问题的过程用sql语句演示给大家演示一下 首先我使用的是myBATis-p...
    99+
    2024-04-02
  • MySQL去重中distinct和group by的区别浅析
    今天在写业务需要对数据库重复字段进行去重时,因为是去重,首先想到的是distinct关键字。于是一小时过去了。。。。(菜鸟一个,大家轻点骂) 我把问题的过程用sql语句演示给大家演示...
    99+
    2022-11-13
    mysql去重distinct和group by mysql distinct group by MySQL去重复
  • Mysql中distinct与group by的去重方面的区别
    distinct简单来说就是用来去重的,而group by的设计目的则是用来聚合统计的,两者在能够实现的功能上有些相同之处,但应该仔细区分。 单纯的去重操作使用distinct,速度是快于group by的...
    99+
    2024-04-02
  • MySQL 中 SELECT DISTINCT 与 GROUP BY 的区别?
    SELECT DISTINCT 可用于给出不同的值。用它来删除重复的记录并 它也可以与聚合函数一起使用。例如:MAX、AVG等。这个都可以应用 在单个列上。现在,我正在创建一个表以对列使用 SELECT DISTINCT。创建一个表...
    99+
    2023-10-22
  • sql中order by和group by的区别是什么
    sql中order by和group by的区别是什么,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。order by 从英文里...
    99+
    2024-04-02
  • mysql中group by是什么意思
    group by 是一个 sql 聚合函数,用于按指定列对数据行进行分组,并对每个组执行计算。其语法为:select 列名, 聚合函数(列名) from 表名 group by...
    99+
    2024-04-26
    mysql 聚合函数
  • mysql中distinct多个字段去重的方法是什么
    在MySQL中,可以使用GROUP BY子句来实现多个字段的去重。具体的语法如下: SELECT DISTINCT colu...
    99+
    2024-04-09
    mysql
  • hive中order by与distribute by的区别和联系是什么
    本篇内容主要讲解“hive中order by与distribute by的区别和联系是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“hive中order by与distribute by的区...
    99+
    2023-06-04
  • MYSQL中#和$的区别是什么
    小编给大家分享一下MYSQL中#和$的区别是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!他们之间的区别用最直接的话来说就是...
    99+
    2024-04-02
  • MySQL中“:=”和“=”的区别是什么
    小编给大家分享一下MySQL中“:=”和“=”的区别是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!=只有在set和upda...
    99+
    2024-04-02
  • mysql中count和distinct的用法是什么
    在MySQL中,COUNT()函数用于计算指定列中的行数,而DISTINCT关键字用于指定只统计不同的值。通常情况下,COUNT()...
    99+
    2024-04-09
    mysql
  • mysql和sqlite区别是什么
    1.MYSQL是完善的服务器数据库,功能全面,综合化,追求最大并发效率;而SQLITE是单机数据库,功能简约,小型化,追求最大磁盘效率。MySql主要用来做服务端的开发;而Sqlite是用来做客户端开发。SQLite没有内置的身份验证机制,...
    99+
    2024-04-02
  • sqlserver和mysql区别是什么
    sqlserver和mysql区别是:1、Server适用于Windows操作系统,而MySQL适用于多个操作系统;2、Server需要购买许可证才能使用,而MySQL可以免费下载和使用;3、Server适用于大型企业级应用程序,而MySQ...
    99+
    2023-08-14
  • mysql中date和datetime的区别是什么
    在MySQL中,DATE和DATETIME都是用于存储日期和时间信息的数据类型,但它们之间有一些区别: DATE类型存储日期信息,...
    99+
    2024-04-09
    mysql
  • mysql中in和exists的区别是什么
    这篇文章主要介绍mysql中in和exists的区别是什么,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!exists和in的区别有:in是把外表和内表做hash连接,先查询内表;ex...
    99+
    2024-04-02
  • mysql中int和bigint的区别是什么
    这篇文章将为大家详细讲解有关mysql中int和bigint的区别是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。  1 bytes = 8 bit ,...
    99+
    2024-04-02
  • Mysql中 InnoDB和MyISAM的区别是什么
    本篇文章给大家分享的是有关Mysql中 InnoDB和MyISAM的区别是什么,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。 Inn...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作