广告
返回顶部
首页 > 资讯 > 操作系统 >linux中去掉文件重复数据行的方法
  • 709
分享到

linux中去掉文件重复数据行的方法

2023-06-13 03:06:01 709人浏览 独家记忆
摘要

本篇内容主要讲解“linux中去掉文件重复数据行的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“linux中去掉文件重复数据行的方法”吧!一、去掉相邻重复的数据行代码如下:$cat data

本篇内容主要讲解“linux中去掉文件重复数据行的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“linux中去掉文件重复数据行的方法”吧!

一、去掉相邻重复的数据行

代码如下:


$cat data1.txt | uniq  
输出:
beijing  
wuhan  
beijing  
wuhan

二、去掉所有重复的数据行

代码如下:


$cat data1.txt | sort | uniq

注:
只有uniq命令的话,只是把相邻的重复的数据行去掉。
如果先 sort 的话,就会把所有重复的数据行变成相邻的数据行,再 uniq 的话,就去掉所有重复的数据行了。

输出:
beijing 
wuhan

附:data1.txt

代码如下:


[root@syy ~]# cat data1.txt  
beijing  
beijing  
wuhan  
wuhan  
wuhan  
beijing  
beijing  
beijing  
wuhan  
wuhan  

注:在过滤日志中的IP地址很有用。

Linux下删除大数据文件中部分字段重复的行

最近写的一个数据采集程序生成了一个含有1千多万行数据的文件,数据由4个字段组成,按照要求需要删除第二个字段重复的行,找来找去linux下也没找到合适的工具,sed/gawk等流处理工具只能针对一行一行处理,并无法找到字段重复的行。看来只好自己python一个程序了,突然想起来利用mysql,于是进行乾坤大挪移:

利用Mysqlimport --local dbname data.txt导入数据到表中,表名要与文件名一致
2. 执行下列sql语句(要求唯一的字段为uniqfield)

代码如下:


use dbname;
alter table tablename add rowid int auto_increment not null;
create table t select min(rowid) as rowid from tablename group by uniqfield;
create table t2 select tablename .* from tablename,t where tablename.rowid= t.rowid;</p><p>drop table tablename;
rename table t2 to tablename;

到此,相信大家对“linux中去掉文件重复数据行的方法”有了更深的了解,不妨来实际操作一番吧!这里是编程网网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

--结束END--

本文标题: linux中去掉文件重复数据行的方法

本文链接: https://www.lsjlt.com/news/264839.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • linux中去掉文件重复数据行的方法
    本篇内容主要讲解“linux中去掉文件重复数据行的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“linux中去掉文件重复数据行的方法”吧!一、去掉相邻重复的数据行代码如下:$cat data...
    99+
    2023-06-13
  • linux去掉重复行的方法有哪些
    在Linux中,可以使用以下方法去掉重复行:1. 使用`sort`命令和`uniq`命令组合,`sort`命令可以对文件进行排序,`...
    99+
    2023-09-11
    linux
  • shell去掉文件中空行(空白行)的方法详解
    本文详细介绍了使用shell去除文件中的空行的方法,学习下sed、awk、shell文件检测的方法,有需要的朋友可以作个参考。本节内容:shell去掉文件中空行 1,shell 去掉文件中的空行 cat ...
    99+
    2022-06-04
    空行 详解 空白
  • linux中如何使用awk删掉文件中重复的行
    这篇文章将为大家详细讲解有关linux中如何使用awk删掉文件中重复的行,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。TL;DR要保持原来的排列顺序删掉重复行,使用:awk '!visi...
    99+
    2023-06-16
  • mysql数据库去除重复数据的方法
    这篇文章主要介绍了mysql数据库去除重复数据的方法,具有一定借鉴价值,需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获。下面让小编带着大家一起了解一下。mysql数据库去除重复数据的方法:1、查询需...
    99+
    2022-10-18
  • EXCEL怎么去除文件中的重复行
    本篇内容介绍了“EXCEL怎么去除文件中的重复行”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!在EXCEL...
    99+
    2022-10-19
  • Oracle表中重复数据去重的方法实例详解
    Oracle表中重复数据去重的方法实例详解 我们在项目中肯定会遇到一种情况,就是表中没有主键 有重复数据 或者有主键 但是部分字段有重复数据 而我们需要过滤掉重复数据 下面是一种解决方法 del...
    99+
    2022-10-18
  • SQL中去除重复数据的几种方法汇总(窗口函数对数据去重)
    目录方法1:distinct方法2:group by方法3:窗口函数使用SQL对数据进行提取和分析时,我们经常会遇到数据重复的场景,需要我们对数据进行去重后分析。 以某电商公司的销售报表为例,常见的去重方法我们用到dis...
    99+
    2023-05-05
    sql去除重复数据 sql去重复
  • shell中删除文件中重复行的方法
    Linux下文本处理工具很丰富很强大,例如这样一个文件: cat log www.lsjlt.com 192.168.1.1www.lsjlt.com 192.168.1.1www.lsjlt.com 19...
    99+
    2022-06-04
    文件 方法 shell
  • php合并数组去除重复数据的方法
    这篇文章主要讲解了“php合并数组去除重复数据的方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“php合并数组去除重复数据的方法”吧!在php中,可以利用array_merge()和arr...
    99+
    2023-06-20
  • python去除重复数据的方法是什么
    Python中去除重复数据的方法有多种,下面是其中两种常见的方法:1. 使用集合(set)去除重复数据:将数据转换为集合类型,集合具...
    99+
    2023-08-09
    python
  • 大数据中文本怎么按行去除重复值
    这篇文章跟大家分析一下“大数据中文本怎么按行去除重复值”。内容详细易懂,对“大数据中文本怎么按行去除重复值”感兴趣的朋友可以跟着小编的思路慢慢深入来阅读一下,希望阅读后能够对大家有所帮助。下面跟着小编一起深入学习“大数据中文本怎么按行去除重...
    99+
    2023-06-03
  • php数据库去除重复数据的方法是什么
    本篇内容介绍了“php数据库去除重复数据的方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!php数据库去除重复数据的方法:1、打开相...
    99+
    2023-06-25
  • vue中数组怎么去除重复数据(三种方法)
    在Vue的开发过程中,我们经常会使用到数组。但是在实际开发中,有时候会遇到重复数据的问题,这时候我们就需要对数组进行去重操作。本文将为大家介绍Vue中数组去重的方法。一、使用set结构去重set是ES6中的一种数据结构,可以去除重复元素,其...
    99+
    2023-05-14
  • oracle数据库去除重复数据常用的方法总结
    目录创建测试数据针对指定列,查出去重后的结果集distinctrow_number()针对指定列,查出所有重复的行count havingcount over删除所有重复的...
    99+
    2022-11-13
  • linux实现复制文件并重命名的方法
    小编给大家分享一下linux实现复制文件并重命名的方法,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!在linux中,可以使用“cp 选项 源文件或目录 目标文件或目录”命令来实现复制文件并重命名。cp指令用于复制文件或目录...
    99+
    2023-06-15
  • Linux下怎么删除大数据文件中部分字段重复行
    本篇内容介绍了“Linux下怎么删除大数据文件中部分字段重复行”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!最近写的一个数据采集程序生成了一...
    99+
    2023-06-13
  • 删除数据库中重复数据的方法
    这篇文章主要介绍“删除数据库中重复数据的方法”,在日常操作中,相信很多人在删除数据库中重复数据的方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”删除数据库中重复数据的方法”...
    99+
    2022-10-18
  • linux复制文件夹并重命名的方法是什么
    在Linux中,可以使用`cp`命令复制文件夹并重命名。命令的基本语法如下:```cp -r 源文件夹路径 目标文件夹路径```其中...
    99+
    2023-08-21
    linux
  • linux中cp命令复制文件的方法
    这篇文章将为大家详细讲解有关linux中cp命令复制文件的方法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。在linux中,可以使用cp命令复制文件,将源文件或目录复制到指定的目的文件或目录;它可以将单个...
    99+
    2023-06-14
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作