广告
返回顶部
首页 > 资讯 > 后端开发 > Python >用Python实现大文本文件切割
  • 799
分享到

用Python实现大文本文件切割

文本文件Python 2023-01-31 05:01:44 799人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

在实际工作中,有些场景下,因为产品既有功能限制,不支持特大文件的直接处理,需要把大文件进行切割处理。 当然可以通过UltraEdit编辑工具,或者从网上下载一些文件切割器之类的。但这些要么手工操作太麻烦,要么不能满足自定义需求。 而且,对

在实际工作中,有些场景下,因为产品既有功能限制,不支持特大文件的直接处理,需要把大文件进行切割处理。

当然可以通过UltraEdit编辑工具,或者从网上下载一些文件切割器之类的。但这些要么手工操作太麻烦,要么不能满足自定义需求。

而且,对程序员来说,DIY一个轮子还是有必要的。


python作为快速开发工具,其代码表达力强,开发效率高,因此用Python快速写一个,还是可行的。

需求描述:

    输入:给定一个带列头的csv文件,或者txt文件,或者其他文本文件。

    输出:指定单文件内部行数的一系列可区分小文件。

开发环境:Python 3.6

代码如下:

# -*- coding: cp936 -*-
import os
import time

def mkSubFile(lines,head,srcName,sub):
    [des_filename, extname] = os.path.splitext(srcName)
    filename  = des_filename + '_' + str(sub) + extname
    print( 'make file: %s' %filename)
    fout = open(filename,'w')
    try:
        fout.writelines([head])
        fout.writelines(lines)
        return sub + 1
    finally:
        fout.close()

def splitByLineCount(filename,count):
    fin = open(filename,'r')
    try:
        head = fin.readline()
        buf = []
        sub = 1
        for line in fin:
            buf.append(line)
            if len(buf) == count:
                sub = mkSubFile(buf,head,filename,sub)
                buf = []
        if len(buf) != 0:
            sub = mkSubFile(buf,head,filename,sub)   
    finally:
        fin.close()

if __name__ == '__main__':
    begin = time.time()
    splitByLineCount('盂县.csv',600000)
    end = time.time()
    print('time is %d seconds ' % (end - begin))

测试结果:

    1.4GB的csv文件,13列数据,切分成23个小文件,耗时55秒。

--结束END--

本文标题: 用Python实现大文本文件切割

本文链接: https://www.lsjlt.com/news/188405.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 用Python实现大文本文件切割
    在实际工作中,有些场景下,因为产品既有功能限制,不支持特大文件的直接处理,需要把大文件进行切割处理。 当然可以通过UltraEdit编辑工具,或者从网上下载一些文件切割器之类的。但这些要么手工操作太麻烦,要么不能满足自定义需求。 而且,对...
    99+
    2023-01-31
    文本文件 Python
  • python实现大文本文件分割成多个小文件
    本文介绍一种将一个大的文本文件分割成多个小文件的方法 方法一: 1.读取文章所有的行,并存入列表中 2.定义分割成的小文本的行数 3.将原文本内容按一定行数依次写入小文件中 4.此方...
    99+
    2022-11-12
  • golang实现文件切割
    随着存储设备容量的不断增加,越来越多的数据需要存储。在处理大型文件时,常常会遇到内存不足的问题,此时文件切割就成为了一种有效的解决方案。今天我们就来探讨一下如何使用golang实现文件切割。文件切割指的是将一个大文件按照一定的大小切割成若干...
    99+
    2023-05-14
  • python如何实现大文本文件分割成多个小文件
    小编给大家分享一下python如何实现大文本文件分割成多个小文件,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!python可以做什么Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗易懂...
    99+
    2023-06-14
  • Python 音频文件切割
    一直在学的一套美语教程,开头有18秒的音乐,每次都要听一遍,神烦. 索性写个脚本把所有音频开头音乐全部切掉. 参考 http://blog.csdn.net/skywalkerVVV/article/details/416...
    99+
    2023-01-31
    音频文件 Python
  • Shell脚本实现切割tomcat的日志文件
    这篇文章主要介绍“Shell脚本实现切割tomcat的日志文件”,在日常操作中,相信很多人在Shell脚本实现切割tomcat的日志文件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Shell脚本实现切割to...
    99+
    2023-06-09
  • python的​PyPDF2实现pdf文件切割和合并
    今天想使用pdf的切分软件实现pdf文件的切分,但是软件需要会员???好吧,,,,又要会员,这么简单的功能能难倒咱们程序员吗。俗话说自给自足丰衣足食,决定使用python自己切分文件...
    99+
    2022-11-13
  • Linux下如何实现文件切割
    这篇文章主要介绍了Linux下如何实现文件切割,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。linux下文件分割可以通过split命令来实现,可以指定按行数分割和安大小分割两...
    99+
    2023-06-28
  • VBS如何实现文本文件分割脚本
    这篇文章给大家分享的是有关VBS如何实现文本文件分割脚本的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。而Windows下没有一个现存的比较好用的分割工具,所以我用VBS做了一个文本文件的分割工具,和各位网友共享。...
    99+
    2023-06-08
  • Shell脚本切割tomcat的日志文件
    鉴于在调试logback和log4j的文件切割一直无法成功,随性用shell写个脚本用来切割tomcat下的日志文件(大家如果有在logback或log4j使用文件切割成功的话,可以留下使用方式,先谢谢了)...
    99+
    2022-06-04
    脚本 文件 日志
  • Java如何实现用hash方法切割文件
    小编给大家分享一下Java如何实现用hash方法切割文件,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是...
    99+
    2023-05-30
    java hash
  • java大文件切割的方法是什么
    Java中切割大文件的方法有多种,以下是其中一种常见的方法:1. 使用RandomAccessFile类:- 打开需要切割的源文件和...
    99+
    2023-08-16
    java
  • python的​PyPDF2怎么实现pdf文件切割和合并
    这篇文章将为大家详细讲解有关python的PyPDF2怎么实现pdf文件切割和合并,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。在百度了一番后,发现大多都是使用 Adobe Acrobat 软件进行剪裁,...
    99+
    2023-06-29
  • python实现按行切分文本文件的方法
    本文实例讲述了python实现按行切分文本文件的方法。分享给大家供大家参考,具体如下: python脚本利用shell命令来实现文本的操作, 这些命令大大减少了我们的代码量。 比如按行切分文件并返回切分后得...
    99+
    2022-06-04
    切分 文本文件 方法
  • 如何实现Linux Tomcat7 catalina.out日志文件切割
    如何实现Linux Tomcat7 catalina.out日志文件切割,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Tomcat的catalina.out并没...
    99+
    2023-06-28
  • Logrotate如何实现每小时切割日志文件
    目录一、Logrotate背景介绍1.1 安装二、logrotate配置介绍三、实现每小时切割日志文件3.1、添加 logrotate 配置文件3.2 执行命令3.3加入定时任务总结...
    99+
    2023-05-19
    Logrotate切割日志文件 Logrotate日志文件切割 日志切割Logrotate
  • Linux下如何使用split切割文件和合并文件
    这篇文章主要介绍了Linux下如何使用split切割文件和合并文件,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。split使用split:可以将一个大文件分割成很多个小文件,...
    99+
    2023-06-28
  • python与php实现分割文件代码
    前两天有个朋友说,想实现一个文本文件按照固定行数进行分割成多个文本文件,却不知如何实现。如果数据量小手动分割下就好了,如果数据量很大的话手动完成实在太耗费人力了,也不现实。那么就需要借助脚本去实现。既然有朋...
    99+
    2022-06-04
    代码 文件 python
  • Linux下如何使用sed命令切割文本
    这篇文章主要介绍了Linux下如何使用sed命令切割文本,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。sed是一个流(stream)编辑器,每次读取文本中的一行,放到内存的缓...
    99+
    2023-06-27
  • vbs怎么实现的支持拖动的txt文本切割器
    这篇文章主要介绍vbs怎么实现的支持拖动的txt文本切割器,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!'    Set objArgs =&nbs...
    99+
    2023-06-08
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作