广告
返回顶部
首页 > 资讯 > 前端开发 > JavaScript >Java如何高效的读取一个超大文件
  • 471
分享到

Java如何高效的读取一个超大文件

2024-04-02 19:04:59 471人浏览 薄情痞子
摘要

这篇文章主要介绍“Java如何高效的读取一个超大文件”,在日常操作中,相信很多人在Java如何高效的读取一个超大文件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java如何

这篇文章主要介绍“Java如何高效的读取一个超大文件”,在日常操作中,相信很多人在Java如何高效的读取一个超大文件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java如何高效的读取一个超大文件”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

前言

我最近在优化我的pdfWord开源工具,有时候会遇到一个问题,就是如果我的PDF文件比较大,几百兆,如何更快更节省内存的读取它。于是我分析对比了四种常见的读取文件的方式,并使用javaVisualVM工具进行了分析。最后的出的结论是commons-io时间和空间都更加的高效。研究分析依然来自哪位baeldung国外大佬。

下面我会给出几种常见的读取大文件的方式。

读取大文件的四种方式

首先我自己在本地压缩了一个文件夹,大概500M左右。虽然不是很大但是,相对还可以。

方法1:Guava读取

String path = "G:\\java书籍及工具.zip"; Files.readLines(new File(path), Charsets.UTF_8);

使用guava读取比较简单,一行代码就搞定了。

下面去jdk的bin目录找到javaVisualVM工具,然后双击运行即可。

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:20秒

  • 堆内存:最高2.5G

  • CPU消耗:最高50%

我们一个500M的文件,堆内存最高竟然2.5G,如果我们读取一个2G的文件,可能我们的电脑直接死机了就。

方式2:Apache Commons IO普通方式

String path = "G:\\java书籍及工具.zip"; FileUtils.readLines(new File(path), Charsets.UTF_8);

这种方式也比较简单,同样是一行代码。下面运行,也分析一波:

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:17秒

  • 堆内存:最高2.5G

  • CPU消耗:最高50%,平稳运行25%左右

这种方式和上面那种基本上消耗差不多,肯定不是我想要的。

方式3:java文件流

FileInputStream inputStream = null; Scanner sc = null; try {      inputStream = new FileInputStream(path);      sc = new Scanner(inputStream, "UTF-8");      while (sc.hasNextLine()) {           String line = sc.nextLine();           //System.out.println(line);      }      if (sc.ioException() != null) {           throw sc.ioException();      } } finally {      if (inputStream != null) {           inputStream.close();      }      if (sc != null) {            sc.close();      } }

这种方式其实就是java中最常见的方式,然后我们运行分析一波:

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:32秒,增加了一倍

  • 堆内存:最高1G,少了一半

  • CPU消耗:平稳运行25%左右

这种方式确实很优秀,但是时间上开销更大。

方式4:Apache Commons IO流

LineIterator it = FileUtils.lineIterator(new File(path), "UTF-8"); try {       while (it.hasNext()) {           String line = it.nextLine();       } } finally {      LineIterator.closeQuietly(it); }

这种方式代码看起来比较简单,所以直接运行一波吧:

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:16秒,最低

  • 堆内存:最高650M,少了一半

  • CPU消耗:平稳运行25%左右

OK,就它了,牛。

结论

通过以上的分析,我们可以得出一个结论,如果我们想要读取一个大文件,选择了错误的方式,就有可能极大地占用我的内存和CPU,当文件特别大时,会造成意向不到的问题。

因此为了去解决这样的问题,有四种常见的读取大文件的方式。通过分析对比,发现,Apache Commons IO流是最高效的一种方式。

到此,关于“Java如何高效的读取一个超大文件”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

--结束END--

本文标题: Java如何高效的读取一个超大文件

本文链接: https://www.lsjlt.com/news/67917.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Java如何高效的读取一个超大文件
    这篇文章主要介绍“Java如何高效的读取一个超大文件”,在日常操作中,相信很多人在Java如何高效的读取一个超大文件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java如何...
    99+
    2022-10-19
  • 怎么用Java高效读取大文件
    这篇文章主要讲解了“怎么用Java高效读取大文件”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么用Java高效读取大文件”吧!内存读取第一个版本,阿粉采用...
    99+
    2022-10-19
  • Java高效读取大文件实例分析
    1、概述本教程将演示如何用Java高效地读取大文件。Java——回归基础。2、在内存中读取读取文件行的标准方式是在内存中读取,Guava和ApacheCommonsIO都提供了如下所示快速读取文件行的方法:Files.readLines(n...
    99+
    2023-05-30
  • python如何读取一个大于10G的txt文件
    这篇文章给大家分享的是有关python如何读取一个大于10G的txt文件的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。前言用python 读取一个大于10G 的文件,自己电脑只有8G内存,一运行就报内存溢出:Me...
    99+
    2023-06-15
  • java如何读取大文件文本
    Java可以使用`BufferedReader`类来读取大文件文本。`BufferedReader`类提供了一个`readLine(...
    99+
    2023-08-08
    java
  • python如何流式读取数G超大文件
    这篇文章将为大家详细讲解有关python如何流式读取数G超大文件,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。如何流式读取数G超大文件使用 with...open... 可以从一个文件中读取数据,这是所有...
    99+
    2023-06-27
  • Java如何读取整个文件流
    在Java中,可以使用`InputStream`类来读取文件流。以下是一个示例代码,演示如何读取整个文件流并将其打印出来:```ja...
    99+
    2023-08-26
    Java
  • python读取一个大于10G的txt文件的方法
    前言 用python 读取一个大于10G 的文件,自己电脑只有8G内存,一运行就报内存溢出:MemoryError python 如何用open函数读取大文件呢? 读取大文件 首先可...
    99+
    2022-11-12
  • 一个简单的Java文件读取的进度条
    目录Java 文件读取的进度条运行截图相关代码简要说明Java 文件读取的进度条 最近在做一个小的软件,想使用一下文件读取的进度条,发现书上有一个例子,但是运行之后发现无法显示进度条...
    99+
    2023-05-14
    Java文件读取 Java文件读取进度条
  • Java中如何使用缓存提高文件读取效率?
    在Java开发中,读取文件是非常常见的操作。但是,如果文件比较大,或者需要频繁读取,那么每次都读取文件的话,效率会非常低下。这时候,我们可以考虑使用缓存来提高文件读取效率。 Java中提供了多种缓存方式,比如使用缓存流、使用Buffere...
    99+
    2023-06-28
    缓存 文件 leetcode
  • 利用java读取超大文件时出现内存溢出如何解决
    利用java读取超大文件时出现内存溢出如何解决?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。1. 传统方式:在内存中读取文件内容读取文件行的标准方式是在内存中读...
    99+
    2023-05-31
    java ava
  • 如何实现一个读取xml文件内容的类
    这篇文章将为大家详细讲解有关如何实现一个读取xml文件内容的类,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。一个读取xml文件内容的类 package project.util.xml;import ja...
    99+
    2023-06-03
  • java读取大文件内存溢出如何解决
    在Java中,如果读取大文件时遇到内存溢出的问题,可以尝试以下几种解决方案:1. 使用缓冲区:使用BufferedReader或者B...
    99+
    2023-08-25
    java
  • python如何批量读取一个文件夹里的所以excel文件
    绪论 在数据分析工作中,尝尝需要处理多个不同月的excel文件,但无奈与excel文件的局限性,不能同时处理多个月的excel数据,所以python的批量读取excel文件就显得十分重要,下面我将展示如何用python将每个月度的excel...
    99+
    2023-09-03
    excel python numpy pandas 数据分析
  • java多线程读取同一个文件的方法是什么
    在Java中,可以使用多线程读取同一个文件的方法有两种:1. 使用多个线程分别读取文件的不同部分:这种方法需要将文件分成多个部分,每...
    99+
    2023-09-13
    java
  • 如何提高Android从文件中读取图像的效率
    本篇文章给大家分享的是有关如何提高Android从文件中读取图像的效率,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。方法一start_time = Syst...
    99+
    2023-05-31
    android roi %d
  • java如何读取某个文件夹中的全部文件(包括子文件夹)
    目录java读取某个文件夹中的全部文件主要思路示例java获取文件夹下指定的文件java读取某个文件夹中的全部文件 主要思路 使用file.listFiles()函数可以获取到某文...
    99+
    2022-12-03
    java读取文件 java读取全部文件 java读取子文件夹
  • perl如何读取csv文件中的一行
    在Perl中,可以使用Text::CSV模块来读取CSV文件。下面是一个示例代码,演示了如何读取CSV文件中的一行:```perlu...
    99+
    2023-10-07
    perl
  • 在Java项目中使用递归如何实现一个文件读取功能
    今天就跟大家聊聊有关在Java项目中使用递归如何实现一个文件读取功能,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。Java递归列出目录下全部文件 import java.i...
    99+
    2023-05-31
    java 递归 文件读取
  • 如何使用go编写一个高效的文件框架?
    Go是一种非常流行的编程语言,其简单性、可靠性和高效性使其成为许多开发人员的首选语言。在本文中,我们将探讨如何使用Go编写一个高效的文件框架,让您可以轻松地读取、写入和处理文件。 一、文件操作 在Go中,我们可以使用os包来进行文件操作。...
    99+
    2023-11-10
    文件 框架 shell
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作