首页 > 资讯 > 后端开发 > Python >python3读取文件指定行的三种方法

844

分享到

python3读取文件指定行的三种方法

python 读取行 python 读取指定行 2022-06-02 22:06:24 844人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

目录行遍历实现linecache实现命令行sed获取总结概要行遍历实现在python中如果要将一个文件完全加载到内存中，通过file.readlines()即可，但是在文件占用较高时，我们是无法完整的将文件加载到

行遍历实现

在python中如果要将一个文件完全加载到内存中，通过file.readlines()即可，但是在文件占用较高时，我们是无法完整的将文件加载到内存中的，这时候就需要用到Python的file.readline()进行迭代式的逐行读取：


filename = 'hello.txt'

with open(filename, 'r') as file:
    line = file.readline()
    counts = 1
    while line:
        if counts >= 50000000:
            break
        line = file.readline()
        counts += 1

这里我们的实现方式是先用一个with语句打开一个文件，然后用readline()函数配合while循环逐行加载，最终通过一个序号标记来结束循环遍历，输出文件第50000000行的内容。该代码的执行效果如下：


dechin@ubuntu2004:~/projects/gitlab/dechin/$ time python3 get_line.py 

real    0m10.359s
user    0m10.062s
sys     0m0.296s

可以看到这里的耗时为10s多一些。

linecache实现

虽然在python的readline函数中并没有实现读取指定行内容的方案，但是在另一个库linecache中是实现了的，由于使用的方式较为简单，这里直接放上代码示例供参考：


filename = 'hello.txt'

import linecache
text = linecache.getline(filename, 50000000)

该代码的执行结果如下：


dechin@ubuntu2004:~/projects/gitlab/dechin/$ time python3 get_line.py 

real    0m11.904s
user    0m5.672s
sys     0m6.231s

虽然在实现方式上简化了许多，但是我们发现这个实现的用时超过了11s，还不如我们自己手动实现的循环遍历方案。因此如果是对于性能有一定要求的场景，是不建议采用这个方案的。

命令行sed获取

我们知道用linux系统本身自带的sed指令也是可以获取到文件指定行或者是指定行范围的数据的，其执行指令为：sed -n 50000000p filename即表示读取文件的第50000000行的内容。同时结合python的话，我们可以在python代码中执行系统指令并获取输出结果：


filename = 'hello.txt'

import os
result = os.popen('sed -n {}p {}'.fORMat(50000000, filename)).read()

需要注意的是，如果直接运行os.system()是没有返回值的，只有os.popen()是有返回值的，并且需要在尾巴加上一个read()的选项。该代码的执行结果如下：


dechin@ubuntu2004:~/projects/gitlab/dechin/$ time python3 get_line.py 

real    0m2.532s
user    0m0.032s
sys     0m0.020s

可以看到直接使用sed指令的执行速度很快，但是用这种方法并不是一本万利的，比如以下这个例子：


filename = 'hello.txt'

import os
result = os.popen('sed -n {}p {}'.format(500, filename)).read()

我们把读取第50000000行内容改为读取第500行的内容，再运行一次程序：


dechin@ubuntu2004:~/projects/gitlab/dechin/$ time python3 get_line.py 

real    0m2.540s
user    0m0.037s
sys     0m0.013s

然而我们发现这个速度并没有因为要读取的行数减少了而变少，而是几乎保持不变的。

总结概要

本文通过4个测试案例分析了在python中读取文件指定行内容的方案，并得到了一些运行耗时的数据。从需求上来说，如果是对于小规模的数据，比如几百行规模的数据，建议使用readline循环遍历来操作，速度也相当不错，或者是linecache中的函数实现也是可以的，甚至可以直接用readlines将整个文本内容加载到内存中。但是对于数据规模比较大的场景，比如超过了千万行的级别，那么使用sed指令的方式对指定行内容进行读取的方式，应该是所有方式中最快速的。

本文首发链接为：https://www.cnblogs.com/dechinphy/p/lbl.html

作者ID：DechinPhy

以上就是python3读取文件指定行的三种方法的详细内容，更多关于python读取文件指定行的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: python3读取文件指定行的三种方法

本文链接: https://www.lsjlt.com/news/10728.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

python3读取文件指定行的三种方法

目录

行遍历实现

linecache实现

命令行sed获取

总结概要

本篇文章演示代码以及资料文档资料下载

python3读取文件指定行的三种方法

三种方法Python读取文件指定行，来看看你用过没？

使用python3怎么读取文件指定行

Golang按行读取文件的三种方法小结

Go读取文件与写入文件的三种方法操作指南

Python之读取TXT文件的三种方法

Node.js读取文件的三种方式

Shell逐行读取文件的4种方法

shell按行读取文件的3种方法

go按行读取文件的三种实现方式汇总

Python读取指定的TXT文本文件并从中提取指定数据的方法

SpringBoot 常用读取配置文件的三种方法详解

python怎么读取csv文件指定行

Java读取文本文件的各种方法

java读取excel文件的两种方法

Python读取CSV文件的几种方法

Go语言读取文本文件的三种方式总结

用Shell实现逐行读取文件的4种方法

Java实现从jar包中读取指定文件的方法

SpringBoot读取Resource下文件的4种方法

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python进程池创建队列的方法是什么

python字符串处理与应用的方法有哪些

python全局变量如何定义

python如何读取文件夹下所有文件

python keyerror错误怎么解决

python如何提取字符串的数字

python中怎么将回车作为输入内容