广告
返回顶部
首页 > 资讯 > 数据库 >MySQL 如何查找并删除重复记录的实现
  • 934
分享到

MySQL 如何查找并删除重复记录的实现

MySQL查找重复记录MySQL删除重复记录 2022-05-11 04:05:14 934人浏览 泡泡鱼
摘要

大家好,我是只谈技术不剪发的 Tony 老师。由于一些历史原因或者误操作,可能会导致数据表中存在重复的记录;今天我们就来谈谈如何查找 Mysql 表中的重复数据以及如何删除这些重复的记录。 创建示例表 首先创建一个示

大家好,我是只谈技术不剪发的 Tony 老师。由于一些历史原因或者误操作,可能会导致数据表中存在重复的记录;今天我们就来谈谈如何查找 Mysql 表中的重复数据以及如何删除这些重复的记录。

创建示例表

首先创建一个示例表 people 并生成一些数据:


drop table if exists people;
create table people (
 id int auto_increment primary key,
 name varchar(50) not null,
 email varchar(100) not null
);

insert into people(name, email)
values ('张三', 'zhangsan@test.com'),
  ('李四', 'lisi@test.com'),
  ('王五', 'wangwu@test.com'),
  ('李斯', 'lisi@test.com'),
  ('王五', 'wangwu@test.com'),
  ('王五', 'wangwu@test.com');

select * from people;
id|name |email   |
--|------|-----------------|
 1|张三 |zhangsan@test.com|
 2|李四 |lisi@test.com |
 3|王五 |wangwu@test.com |
 4|李斯 |lisi@test.com |
 5|王五 |wangwu@test.com |
 6|王五 |wangwu@test.com |

其中,2 和 4 的 email 字段存在重复数据;3、5 和 6 的 name 和 email 字段存在重复数据。

此时,如果我们想要为 email 创建一个唯一约束,将会返回错误:


alter table people add constraint uk_people_email unique key (email);
ERROR 1062 (23000): Duplicate entry 'wangwu@test.com' for key 'people.uk_people_email'

显然,我们必须找出并删除 email 字段中的重复记录才能创建唯一约束。

查找单个字段中的重复数据

如果想要找出 email 重复的数据,可以基于该字段进行分组统计,并且返回行数大于 1 的分组:


select email, count(email)
from people
group by email
having count(email) > 1;
email   |count(email)|
---------------|------------|
lisi@test.com |   2|
wangwu@test.com|   3|

查询结果显示有两个邮箱地址存在重复情况。如果想要查看完整的重复数据,可以使用子查询或者连接查询:


select *
from people
where email in (
  select email
  from people
  group by email
  having count(email) > 1)
order by email;
id|name |email   |
--|------|---------------|
 2|李四 |lisi@test.com |
 4|李斯 |lisi@test.com |
 3|王五 |wangwu@test.com|
 5|王五 |wangwu@test.com|
 6|王五 |wangwu@test.com|

select p.*
from people p
join (
 select email
 from people
 group by email
 having count(email) > 1
) d on p.email = d.email
order by email;
id|name |email   |
--|------|---------------|
 2|李四 |lisi@test.com |
 4|李斯 |lisi@test.com |
 3|王五 |wangwu@test.com|
 5|王五 |wangwu@test.com|
 6|王五 |wangwu@test.com|

另一种查找重复记录的方法就是直接使用自连接查询和 distinct 操作符,例如:


select distinct p.*
from people p
join people d on p.email = d.email
where p.id <> d.id
order by p.email;
id|name |email   |
--|------|---------------|
 4|李斯 |lisi@test.com |
 2|李四 |lisi@test.com |
 6|王五 |wangwu@test.com|
 5|王五 |wangwu@test.com|
 3|王五 |wangwu@test.com|

注意,不能省略 distinct,否则会某些数据(3、5、6)会返回多次。

查找多个字段中的重复数据

如果我们想要找出 name 和 email 字段都重复的数据,实现方式也类似:


select *
from people
where (name, email) in (
  select name, email
  from people
  group by name, email
  having count(1) > 1)
order by email;
id|name |email   |
--|------|---------------|
 3|王五 |wangwu@test.com|
 5|王五 |wangwu@test.com|
 6|王五 |wangwu@test.com|

select distinct p.*
from people p
join people d on p.name = d.name and p.email = d.email
where p.id <> d.id
order by email;
id|name |email   |
--|------|---------------|
 6|王五 |wangwu@test.com|
 5|王五 |wangwu@test.com|
 3|王五 |wangwu@test.com|

只有当 name 和 email 都相同时才是重复数据,所以 2 和 4 不是重复记录。

删除重复数据

找出重复数据之后,需要解决的就是如何删除了,通常我们需要保留其中的一条记录。

使用 DELETE FROM 删除重复数据

假如我们想要删除 email 重复的记录,只保留其中一条,可以使用 DELETE FROM 语句实现:


delete p
from people p
join people d on p.email = d.email and p.id < d.id;

delete 语句通过连接找出需要删除的记录,以上示例保留了重复数据中的最大 id 对应的数据行。再次查询 people 表:


select * from people;
id|name |email   |
--|------|-----------------|
 1|张三 |zhangsan@test.com|
 4|李斯 |lisi@test.com |
 6|王五 |wangwu@test.com |

想一想,如果想要保留重复数据中 id 最小的数据应该怎么实现呢?

利用子查询删除重复数据

通过子查询可以找出需要保留的数据,然后删除其他的数据:


delete
from people
where id not in (
  select max(id)
  from people
  group by email
  );

在执行上面的语句之前,记得重新创建 people 表并生成测试数据。

通过中间表删除重复数据

通过使用中间表也可以实现重复记录的删除,例如:


-- 创建中间表
create table people_temp like people;

-- 复制需要保留的数据行
insert into people_temp(id, name, email)
select id, name, email
from people
where id in (
  select max(id)
  from people
  group by email
  );

--删除原表
drop table people;

-- 将中间表重命名为原表
alter table people_temp rename to people;

在执行上面的语句之前,记得重新创建 people 表并生成测试数据。

这种方式需要注意的一个问题就是 create table … like 语句不会复制原表上的外键约束,需要手动添加。

利用窗口函数删除重复数据

ROW_NUMBER() 是 mysql 8.0 中新增的窗口函数,可以用于将数据进行分组,然后为每一条数据分配一个唯一的数字编号。例如:


select id, name, email, 
  row_number() over (partition by email order by id) as row_num 
from people;
id|name |email   |row_num|
--|------|-----------------|-------|
 2|李四 |lisi@test.com |  1|
 4|李斯 |lisi@test.com |  2|
 3|王五 |wangwu@test.com |  1|
 5|王五 |wangwu@test.com |  2|
 6|王五 |wangwu@test.com |  3|
 1|张三 |zhangsan@test.com|  1|

以上语句基于 email 分组(partition by email),同时按照 id 进行排序(order by id),然后为每个组内的数据分配一个编号;如果编号大于 1 就意味着存在重复的数据。

📝除了 ROW_NUMBER() 之外,RANK() 或者 DENSE_RANK() 函数也可以实现以上功能。关于窗口函数的介绍和使用案例,可以参考这篇文章。

基于该查询结果可以删除重复的记录:


delete
from people
where id in (
 select id
 from (
  select id,
    row_number() over (partition by email order by id desc) as row_num 
  from people) d
 where row_num > 1);

在执行上面的语句之前,记得重新创建 people 表并生成测试数据。

基于多个字段的重复数据删除方法和单个字段非常类似,大家可以自行尝试,也欢迎留言讨论!

总结

本文介绍了如何在 Mysql 中查找并删除重复记录,包括使用 GROUP BY 分组、子查询或者连接查询等方法查找单个字段或者多个字段中的重复数据,以及使用 DELETE FROM 语句、子查询、中间表和窗口函数等方法实现重复数据的删除。更多相关MySQL 查找并删除重复记录内容请搜索自学编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持自学编程网!

您可能感兴趣的文档:

--结束END--

本文标题: MySQL 如何查找并删除重复记录的实现

本文链接: https://www.lsjlt.com/news/9729.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • MySQL 如何查找并删除重复记录的实现
    大家好,我是只谈技术不剪发的 Tony 老师。由于一些历史原因或者误操作,可能会导致数据表中存在重复的记录;今天我们就来谈谈如何查找 MySQL 表中的重复数据以及如何删除这些重复的记录。 创建示例表 首先创建一个示...
    99+
    2022-05-11
    MySQL 查找重复记录 MySQL 删除重复记录
  • MySQL如何查询和删除重复记录
    这篇文章运用简单易懂的例子给大家介绍MySQL如何查询和删除重复记录,代码非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。查找所有重复标题的记录:select title,count...
    99+
    2022-10-18
  • MySQL 如何查找删除重复行
    目录一、如何查找重复行二、如何删除重复行三、如何查找多列上的重复四、错误的查询语句五、几种正确的方法一、如何查找重复行 第一步是定义什么样的行才是重复行。多数情况下很简单:它们某一...
    99+
    2022-11-12
  • MySQL中如何删除表重复记录
    本篇文章给大家分享的是有关MySQL中如何删除表重复记录,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。 创建实验...
    99+
    2022-10-18
  • MySQL 中如何删除单表重复记录
    本篇文章给大家分享的是有关MySQL 中如何删除单表重复记录,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。1、创建表test001 点击...
    99+
    2022-10-18
  • mysql删除重复记录并且只保留一条的实现方法
    准备的测试表结构及数据 插入的数据中A,B,E存在重复数据,C没有重复记录 CREATE TABLE `tab` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` va...
    99+
    2023-01-04
    mysql删除重复记录 mysql删除记录
  • MySQL中查询、删除重复记录的方法大全
      前言 本文主要给大家介绍了关于MySQL中查询、删除重复记录的方法,分享出来供大家参考学习,下面来看看详细的介绍: 查找所有重复标题的记录: 1 select title,count(*) as cou...
    99+
    2018-05-22
    MySQL中查询 删除重复记录的方法大全
  • MySQL中查询、删除重复记录的方法大全
    前言本文主要给大家介绍了关于MySQL中查询、删除重复记录的方法,分享出来供大家参考学习,下面来看看详细的介绍:查找所有重复标题的记录:select title,count(*) as count&n...
    99+
    2022-08-10
    MySQL 查询 删除
  • 如何删除MySQL表中的所有重复记录?
    要从表中删除重复记录,我们可以使用 DELETE 命令。现在让我们创建一个表。 mysql> create table DuplicateDeleteDemo -> ( -> id int, -...
    99+
    2023-10-22
  • postgresql如何找到表中重复数据的行并删除
    目录PostgreSQL找到表中重复数据的行并删除创建测试表并插入数据找到重复行并删除postgresql常用的删除重复数据方法最高效方法PG中三种删除重复数据方法总结postgresql找到表中重复数据的行并删除 创建...
    99+
    2023-05-05
    postgresql删除重复数据 删除表重复数据行 postgresql重复数据删除
  • 如何通过批处理实现删除运行、查找等处的历史记录
    这篇文章主要介绍了如何通过批处理实现删除运行、查找等处的历史记录,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。批处理代码:代码如下:@echo off :: 删除"...
    99+
    2023-06-08
  • php如何查找和删除数组中的重复数据
    本文小编为大家详细介绍“php如何查找和删除数组中的重复数据”,内容详细,步骤清晰,细节处理妥当,希望这篇“php如何查找和删除数组中的重复数据”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。查找重复项首先,在进行...
    99+
    2023-07-05
  • 一次现场mysql重复记录数据的排查处理实战记录
    目录前言 分析 数据总计 重复次数占比 where 和 having 的区别 总结 前言 我当时正好出差在客户现场部署调试软件,有一天客户突然找到我这里,说他们...
    99+
    2022-11-12
  • 如何用Python寻找重复文件并删除的脚本写法
    这期内容当中小编将会给大家带来有关如何用Python寻找重复文件并删除的脚本写法,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。在实际生活中,经常会有文件重复的困扰,即同一个文件可能既在A目录中,又在B目录...
    99+
    2023-06-28
  • idea如何查找maven依赖、查看依赖关系、删除重复的jar包
    一 先装一个管理pom依赖的插件 File–>Settings–>Plugins–>搜索maven–>找到Maven Helper安装–>重启idea 打开pom.xml剔除重复的包 1 选择Dep...
    99+
    2023-09-30
    intellij-idea jar java
  • mysql如何实现合并结果集并去除重复值
    本篇内容介绍了“mysql如何实现合并结果集并去除重复值”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!mysql 合并结果集并去除重复值SE...
    99+
    2023-07-04
  • jQuery如何实现合并/追加数组并去除重复项的方法
    这篇文章主要为大家展示了“jQuery如何实现合并/追加数组并去除重复项的方法”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“jQuery如何实现合并/追加数组并...
    99+
    2022-10-19
  • Python中如何实现二叉排序树的定义、查找、插入、构造、删除操作
    这篇文章将为大家详细讲解有关Python中如何实现二叉排序树的定义、查找、插入、构造、删除操作,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1. 二叉排序树的定义  二叉排序树 ( B i n a r y...
    99+
    2023-06-15
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作