iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python入门:文件内容去重操作
  • 533
分享到

Python入门:文件内容去重操作

入门操作文件 2023-01-31 02:01:18 533人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++   学习是一种态度,只要你有态度,学习将


+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  学习是一种态度,只要你有态度,学习将会是一种乐趣
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

对行与行之间的重复内容进行删除
如:从网上download几个常用的用户名或密码字典文件,但是合并的时候,肯定有很多是重复的,在使用这些内容进行暴力破解的时候,因为重复行,导致破解效率下降,所以需要进行简单修改,去重:

#user.txt

admin 
root

123
user
passWord 
 admin

administrator

应用代码

#Author:foryouslg
#python3.5
'''
1、对特定文件内容进行去重操作(行与行之间的重复)
2、请输入需要去重文件的绝对路径
3、删除文件中的空行
4、去除字符串前后空行
5、生成一个以当前日期命名的文件
'''

import time

year = time.localtime().tm_year
mon = time.localtime().tm_mon
day = time.localtime().tm_mday
hour = time.localtime().tm_hour
min = time.localtime().tm_min
sec = time.localtime().tm_sec
nowtime = str(year) + str(mon) + str(day) + str(hour) + str(min) + str(sec)

f = input("please entry the file[absolute path]:")

def openThefile():
    '''
    1、打开要去重的文件
    2、删除每行数据前后的无用字符
    :return:
    '''
    ff = open(f,'r')
    l = []
    #for i in ff.readline():     #readline是文件中的第一行内容
    for i in ff.readlines():    #所有内容中的每一行
        if i != '\n' and i != '\r\n':   #删除空行
            ii = i.replace('\t','').strip()
            l.append(ii)
    ff.close()
    return l

def createNewfile(openThefile):
    '''
    去重操作
    :param openThefile:
    :return:
    '''
    l = []
    for i in openThefile:
        if i not in l:
            l.append(i)
    '''
    创建新文件
    '''
    filename = f[:f.find('.')]
    postfix = f[f.find('.'):]
    theNewfile = open(filename + '_' + nowtime + postfix,'a')
    '''
    写入处理过的内容
    '''
    for i in l:
        theNewfile.writelines(i+'\n')
    theNewfile.close()



if __name__ == '__main__':
    createNewfile(openThefile())

执行后的结果

admin
root
123
user
password
administrator

--结束END--

本文标题: Python入门:文件内容去重操作

本文链接: https://www.lsjlt.com/news/185774.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python入门:文件内容去重操作
    +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++   学习是一种态度,只要你有态度,学习将...
    99+
    2023-01-31
    入门 操作 文件
  • python操作文件写入内容
    [root@bogon ~]# cat file.py  #/usr/bin/env python  # coding: utf-8 ecs="efwefwffrfrer" ipaddrr="192.168.56.10" print typ...
    99+
    2023-01-31
    操作 文件 内容
  • python 文件内容对比操作
    #-*-coding:utf-8-*- import re f1 = open('d:/test/mail/bounce_list.txt','r') f2 = open('d:/test/mail/828-...
    99+
    2023-01-31
    操作 文件 内容
  • git入门(3.文件操作)
    三、GIT文件操作  版本控制就是对文件的版本控制,对于Linux来说,设备,目录等全是文件,要对文件进行修改、提交等操作,首先要知道文件当前在什么状态,不然可能会提交了现在还不想提交的文件,或者要提交的文件没提交上。文件状态  GIT仓库...
    99+
    2023-01-31
    入门 操作 文件
  • PHP入门指南:文件操作
    作为一名初学者,PHP 文件操作可能是你需要掌握的基础操作之一。文件操作能使你进行多种操作,包括读取和写入文件,创建和删除文件,以及更重要的是,处理上传文件。在本篇文章中,我们将探讨PHP文件操作的基础知识。检查文件是否存在在进行文件操作之...
    99+
    2023-05-20
    PHP 文件操作 入门指南
  • Python文件操作,open读写文件,追加文本内容实例
    1.open使用open打开文件后一定要记得调用文件对象的close()方法。比如可以用try/finally语句来确保最后能关闭文件。 file_object = open('thefile.txt...
    99+
    2022-06-04
    文件 实例 文本
  • Linux实现文件内容去重及求交并差集
    一、数据去重 日常工作中,使用Hive或者Impala查询导出来可能会存在数据重复的现象,但又不想重新执行一遍查询(查询时间稍长,导出文件内容多),因此想到了使用Linux命令将文件的内容重复数据进行去除。 案例如下...
    99+
    2022-06-03
    Linux 文件内容 去重 交集 并集
  • Python使用pandas导入xlsx格式的excel文件内容操作代码
    目录Python使用pandas导入xlsx格式的excel文件内容1. 基本导入2. 列标题与数据对齐3. 指定导入某个sheet4. 指定行索引5. 指定列索引6. 指定导入列7...
    99+
    2022-12-23
    Python 导入xlsx格式的excel文件 Python使用pandas导入excel文件
  • 批处理怎么根据文件内容进行重命名操作
    小编给大家分享一下批处理怎么根据文件内容进行重命名操作,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!首先,我有个.dat文件,名字是固定的,需要更改这个文件名.....
    99+
    2023-06-09
  • python入门jupyter基础操作及文本用法
    目录1.jupyter简介2.jupyter基础操作2.1windows更新pip库2.2jupyter安装2.3初次启动jupyter2.4设置密码进入jupyter#再次运行ju...
    99+
    2022-11-12
  • python怎么将列表内容写入文件
    要将列表内容写入文件,可以使用Python的内置函数open()来创建一个文件对象,然后使用文件对象的write()方法将列表内容写...
    99+
    2023-10-25
    python
  • Python内置十大文件操作
    日常对于批量处理文件的需求非常多,经常需要用Python写脚本调用外部文件!本次整理Python中最常用的十大文件操作方法,直接拿来用就行啦!1、创建和打开文件想要操作文件需要先创建或代开指定文件并创建文件对象,用open()方法实现,其语...
    99+
    2023-05-14
    Python 文件操作
  • 基于Python制作一个文件去重小工具
    目录前言实现步骤补充前言 常常在下载网络素材时有很多的重复文件乱七八糟的,于是想实现一个去重的操作。 主要实现思路就是遍历出某个文件夹包括其子文件夹下面的所有文件,最后,将所有文件...
    99+
    2022-11-13
  • C语言文件操作的入门详解教程
    目录一.一些需要掌握的知识点1.文件名2.文件类型3.数据流4.文件缓冲区5.文件指针二.与文件操作相关的一些函数 1.文件的打开及关闭2.文件的顺序读写3.文件的随机读写...
    99+
    2022-11-12
  • android文件操作——读取assets和raw文件下的内容
    来自Resources和Assets 中的文件只可以读取而不能进行写的操作。 assets文件夹里面的文件都是保持原始的文件格式,需要用AssetManager以字节流的形式...
    99+
    2022-06-06
    raw文件 Android
  • Python实现将字典内容写入json文件
    目录1、无序字典2、有序字典3、一键多值字典4、写入json4.1 无缩进4.2 有缩进方法补充Python中有序字典和无序字典,一键多值字典。 Python将字典内容写入json文...
    99+
    2022-11-11
  • python怎样备份文件及写入新内容
    python怎样备份文件及写入新内容,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。 def oper_file(file_name,lines):&nb...
    99+
    2023-06-04
  • Python内置文件操作有哪些
    这篇文章主要讲解了“Python内置文件操作有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python内置文件操作有哪些”吧!1、创建和打开文件想要操作文件需要先创建或代开指定文件并创...
    99+
    2023-07-06
  • C#XML基础入门小结(XML文件内容增删改查清)
    目录前言:什么是XMLXML的优缺点XML的优点XML的缺点XML简单示例XML中5个预定义的实体引用C#把特殊符号转换为转义字符C#创建简单的XML文件  创建生成的Xml文件C#...
    99+
    2022-11-13
  • 批处理如何实现根据文件内容进行重命名操作
    这篇文章将为大家详细讲解有关批处理如何实现根据文件内容进行重命名操作,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。我想实现以下的目的: 首先,我有个.dat文件,名字是固定的,需要更改这个文件名. .da...
    99+
    2023-06-09
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作