利用Python读取文件的四种不同方法比对

四种比对文件 2022-06-04 18:06:25 216人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

前言大家都知道python 读文件的方式多种多样，但是当需要读取一个大文件的时候，不同的读取方式会有不一样的效果。下面就来看看详细的介绍吧。场景逐行读取一个 2.9G 的大文件 CPU i7

前言

大家都知道python 读文件的方式多种多样，但是当需要读取一个大文件的时候，不同的读取方式会有不一样的效果。下面就来看看详细的介绍吧。

场景

逐行读取一个 2.9G 的大文件

CPU i7 6820HQ RAM 32G

方法

对每一行的读取进行一次分割字符串操作

以下方法都使用 with…as 方法打开文件。

with 语句适用于对资源进行访问的场合，确保不管使用过程中是否发生异常都会执行必要的“清理”操作，释放资源，比如文件使用后自动关闭、线程中锁的自动获取和释放等。

方法一最通用的读文件方式


with open(file, 'r') as fh:
 for line in fh.readlines():
 line.split("|")

运行结果：耗时 15.4346568584 秒

系统监视器中显示内存从 4.8G 一下子飙到了 8.4G， fh.readlines() 将读取的所有行数据存到内存，这种方法适合小文件。

方法二


with open(file, 'r') as fh:
 line = fh.readline()
 while line:
 line.split("|")

运行结果：耗时 22.3531990051 秒

内存几乎没有变化，因为内存中只存取一行的数据，但是时间明显比上一次的长，对于进一步处理数据来说效率不高。

方法三


with open(file) as fh:
 for line in fh:
 line.split("|")

运行结果：耗时 13.9956979752 秒

内存几乎没有变化，速度也比方法二快。

for line in fh 将文件对象 fh 视为可迭代的，它自动使用缓冲的 io 和内存管理，因此您不必担心大文件。这是很 Pythonic 的方式！

方法四 fileinput 模块


for line in fileinput.input(file):
 line.split("|")

运行结果：耗时 26.1103110313 秒

内存增加了 200-300 MB，速度是以上最慢的。

总结

以上方法仅供参考，公认的大文件读取方法还是三最好。但是具体情况还是要根据机器的性能、处理数据的复杂度。

好了，以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流，谢谢大家对编程网的支持。

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 利用Python读取文件的四种不同方法比对

本文链接: https://www.lsjlt.com/news/13261.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

利用Python读取文件的四种不同方法比对

前言大家都知道Python 读文件的方式多种多样，但是当需要读取一个大文件的时候，不同的读取方式会有不一样的效果。下面就来看看详细的介绍吧。场景逐行读取一个 2.9G 的大文件 CPU i7 ...

99+

2022-06-04

四种比对文件
Python读取文件的四种方式的实例详解

目录学生数量特别少的情况停车场空间不够时怎么办？怎么加快执行效率？怎么加快处理速度？结语故事背景：最近在处理Wikipedia的数据时发现由于数据量过大，之前的文件读取和数据处理方法...

99+

2022-11-13
Python读取CSV文件的几种方法

话不多说，开干！！！目录 1. 使用 csv 模块 2.使用 numpy 库 3.使用pandas库 4.使用标准库中的 csv 模块 5.注意事项 1. 使用 csv 模块（1）项目目录如下图所示：（2）代码如下： impor...

99+

2023-08-31

python 开发语言 pandas numpy
利用Python判断文件的几种方法及其优劣对比

目录前言懒人的try语句传统的os模块时尚的pathlib模块几种方法优劣对比总结前言我们知道当文件不存在的时候，open()方法的写模式与追加模式都会新建文件，但是对文件进行判断...

99+

2022-11-11
java读取XML文件的四种方法总结(必看篇)

JAVA操作XML文档主要有四种方式，分别是DOM、SAX、JDOM和DOM4J，DOM和SAX是官方提供的，而JDOM和DOM4J则是引用第三方库的，其中用的最多的是DOM4J方式。运行效率和内存使用方面最优的是SAX，但是由于SAX是基...

99+

2023-05-31

java 读取 xml文件
Python之读取TXT文件的三种方法

参考了https://blog.csdn.net/shandong_chu/article/details/70173952 import sys 方法一：#read txt method one f = open("./image...

99+

2023-01-31

三种文件方法
python常见读取语音的3种方法速度对比

python 读取语音文件时，常用的无非以下三种方式，但是在我们数据量变的很大是，不同的读取方式之间的性能差异就会被进一步放大，于是本文着重对比了librosa、soundfile、...

99+

2022-12-30

Python读取语音文件 python怎么读语音 python语音处理
实例讲解python读取各种文件的方法

目录1.yaml文件2.CSV文件3.ini文件总结1.yaml文件 # house.yaml--------------------------------------------...

99+

2022-11-13
利用Java怎么对比两个文本文件的相同与不同之处

本篇文章给大家分享的是有关利用Java怎么对比两个文本文件的相同与不同之处，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。使用需求：文件1里面是需要比较的内容，文件2是被比较的文...

99+

2023-05-31

java ava
python文件读取read及readlines两种方法使用详解

目录引言.read([size])方法.readlines()方法引言 with open() as 和open()都是打开，还没有读入文件假设test.fa的内容如下图所示： A...

99+

2022-11-11
教你用Python读取CSV文件的5种方式

目录第一招：简单的读取第二招：用nametuple第三招：用tuple类型转换第四招：用DictReader第五招：用字典转换在python里面，读取或写入csv文件时，首先要imp...

99+

2022-11-12
SpringBoot 常用读取配置文件的 3 种方法！

我们在SpringBoot框架进行项目开发中该如何优雅的读取配置呢？或者说对于一些List或者Map应该如何配置呢？本篇主要解决如下几个问题： Spring Boot有哪些常用的读取配置文件方式？ 1）使用 @Value 读取配置文件 2...

99+

2023-08-17

java 数据库 mysql 面试服务器
python使用pandas读取csv文件的方法

目录pandas读取csv文件的操作1. 读取csv文件在这里记录一下，python使用pandas读取文件的方法用到pandas库的read_csv函数 # -*- coding:...

99+

2022-12-23

python 读取csv文件 pandas读取csv文件
Python基础篇（14）：Python中不同类之间调用方法的四种方式

一、子类使用继承关系，调用父类的方法实现 class A: def method_a(self): print("这是方法A")class B(A): def method_b(self): prin...

99+

2023-10-20

python 开发语言
用Shell实现逐行读取文件的4种方法

这篇文章主要介绍“用Shell实现逐行读取文件的4种方法”，在日常操作中，相信很多人在用Shell实现逐行读取文件的4种方法问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”用Shell实现逐行读取文件的4种方法...

99+

2023-06-09
利用Python读取微信朋友圈的多种方法总结

目录背景法1，不适用法2，已不能用法3：Appnium法4：模拟操作整体代码后续工作及扩展总结背景由于课题需要爬取朋友圈的内容作为研究数据，稍微研究了一下。目前爬取有四种方法，...

99+

2022-11-12
怎么在python中使用read读取不同类型的文件

这篇文章将为大家详细讲解有关怎么在python中使用read读取不同类型的文件，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。python是什么意思Python是一种跨平台的、具有解释性、编译...

99+

2023-06-14
Python使用defaultdict读取文件各列的方法

本文实例讲述了Python使用defaultdict读取文件各列的方法。分享给大家供大家参考，具体如下： #!/usr/bin/python """USAGE: python *.py align_SN...

99+

2022-06-04

文件方法 Python
Shell脚本对比两个文本文件找出不同行的方法介绍

这篇文章主要介绍“Shell脚本对比两个文本文件找出不同行的方法介绍”，在日常操作中，相信很多人在Shell脚本对比两个文本文件找出不同行的方法介绍问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Shell脚本...

99+

2023-06-09
利用Python将list列表写入文件并读取的方法汇总

目录1.writelines()直接写入2.str转化为字符串写入3.for循环写入4.使用.join函数修改列表读取数据附：还有写csv文件和excel文件的方式总结1.write...

99+

2022-11-13