广告
返回顶部
首页 > 资讯 > 后端开发 > JAVA >java 实现读取 word 文件文字内容信息
  • 702
分享到

java 实现读取 word 文件文字内容信息

javaword后端 2023-09-24 20:09:50 702人浏览 安东尼
摘要

【需求】 最近项目中有一个需求,需要实现 java 读取上传的 Word 文件的内容 【实现方法】 现有一文档内容如下: 实现代码如下: 引入依赖: org.apache.poi p

【需求】

最近项目中有一个需求,需要实现 java 读取上传的 Word 文件的内容

【实现方法】

现有一文档内容如下:
在这里插入图片描述

实现代码如下:

  1. 引入依赖:

    <dependency>    <groupId>org.apache.poigroupId>    <artifactId>poi-ooxmlartifactId>    <version>4.1.2version>dependency><dependency>    <groupId>org.apache.poigroupId>    <artifactId>poi-scratchpadartifactId>    <version>4.1.2version>dependency>
  2. 编写工具类如下:

    public class WordUtil {    public static String readDocContent(String wordPath) throws Exception {        String content = "";        if (wordPath.endsWith(".doc")) {            FileInputStream fileInputStream = new FileInputStream(new File(wordPath));            // 获取单词提取器            WordExtractor wordExtractor = new WordExtractor(fileInputStream);            content = wordExtractor.getText();            wordExtractor.close();        } else if (wordPath.endsWith(".docx")) {            OPCPackage opcPackage = POIXMLDocument.openPackage(wordPath);            // 获得文本提取器            POIXMLTextExtractor textExtractor = new XWPFWordExtractor(opcPackage);            content = textExtractor.getText();            textExtractor.close();        } else {            throw new SysException("此文件不是 word 文件");        }        return content;    }        public static String readDocContent(InputStream inputStream, String fileName) throws IOException {        String content = "";        if (fileName.endsWith(".doc")) {            // 获取单词提取器            WordExtractor wordExtractor = new WordExtractor(inputStream);            content = wordExtractor.getText();            wordExtractor.close();        } else if (fileName.endsWith(".docx")) {            XWPFDocument xwpfDocument = new XWPFDocument(inputStream);            // 获得文本提取器            POIXMLTextExtractor textExtractor = new XWPFWordExtractor(xwpfDocument);            content = textExtractor.getText();            textExtractor.close();        } else {            throw new SysException("此文件不是 word 文件");        }        return content;    }}
  3. 编写测试类进行测试:

    @Testpublic void testReadDoc() {    String wordPath = "C:\\Users\\Administrator\\Desktop\\ktest.docx";    // 根据文件路径获取内容    try {        String content = WordUtil.readDocContent(wordPath);        System.err.println(content);    } catch (Exception e) {        throw new RuntimeException(e);    }// 根据输入流获取内容    try {        String content2 = WordUtil.readDocContent(new FileInputStream(wordPath), "ktest.docx");        System.err.println(content2);    } catch (IOException e) {        throw new RuntimeException(e);    }}

    运行输出结果如下:
    在这里插入图片描述

来源地址:https://blog.csdn.net/weixin_44117737/article/details/131451747

--结束END--

本文标题: java 实现读取 word 文件文字内容信息

本文链接: https://www.lsjlt.com/news/417099.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • java 实现读取 word 文件文字内容信息
    【需求】 最近项目中有一个需求,需要实现 java 读取上传的 word 文件的内容 【实现方法】 现有一文档内容如下: 实现代码如下: 引入依赖: org.apache.poi p...
    99+
    2023-09-24
    java word 后端
  • Java如何实现读取txt文件内容并生成Word文档
    目录导入Jar包1. Maven仓库下载导入2. 手动导入读取txt生成Word注意事项本文将以Java程序代码为例介绍如何读取txt文件中的内容,生成Word文档。在编辑代码前,可...
    99+
    2022-11-12
  • java如何读取word文档表格内容
    要读取Word文档中的表格内容,可以使用Apache POI库来处理Word文档。以下是一个简单的示例代码,演示如何读取Word文档...
    99+
    2023-09-22
    java word
  • Java实现读取TXT和CSV文件内容
    目录1.引入java2.实现代码最近在编写一个通用可配置的实时ETL工具,即把通过Flink把Kafka的JSON 格式的数据解析后写入关系型数据库,业务要求新来一个JSON格式的业...
    99+
    2023-02-08
    Java读取TXT Java读取CSV Java读取TXT CSV
  • 怎么用Python对Word文件内容进行读取
    今天小编给大家分享一下怎么用Python对Word文件内容进行读取的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。利用 pyt...
    99+
    2023-06-30
  • java怎么读取json文件内容
    在Java中,可以使用JSON库来读取JSON文件内容。以下是使用Jackson库进行JSON文件读取的示例代码:javaimpor...
    99+
    2023-10-18
    java json
  • java怎么读取excel文件内容
    可以使用Apache POI库来读取Excel文件内容。首先,你需要下载并导入Apache POI库。你可以在官方网站(https:...
    99+
    2023-09-20
    java excel
  • Python自动化办公之Word文件内容的读取
    目录前言利用 python 批量读取文件word利器之python-docxpython-docx 安装python-docx 之 Documentpython-docx 之段落内容...
    99+
    2022-11-11
  • TXT文件的内容如何利用Java实现读取
    本篇文章为大家展示了TXT文件的内容如何利用Java实现读取,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。Java读取txt文件内容。可以作如下理解:首先获得一个文件句柄。File file = n...
    99+
    2023-05-31
    java ava txt
  • C#实现读取txt文件生成Word文档
    目录dll文件安装(3种方法)读取txt生成Word注意事项总结本文将以C#程序代码为例介绍如何来读取txt文件中的内容,生成Word文档。在编辑代码前,可参考如下代码环境进行配置:...
    99+
    2022-11-13
  • Android 读取文件内容实现方法总结
    Android 读取文件内容实现方法,这里整理了几种方法,大家需要可以看下。 如果要打开存放在/data/data/<package name>/files目录应用...
    99+
    2022-06-06
    方法 Android
  • java怎么读取文件内容并写入到另一文件
    在Java中,可以使用`FileReader`和`BufferedReader`来读取文件内容,并使用`FileWriter`和`B...
    99+
    2023-09-20
    Java
  • node.js实现逐行读取文件内容的代码
    在此之前先介绍一个逐行读取文件内容NPM:https://github.com/nickewing/line-reader,需要的朋友可以看看。 直接上代码: function readLines(in...
    99+
    2022-06-04
    代码 文件 内容
  • java maven项目如何读取配置文件信息
    目录maven项目读取配置文件信息主类配置文件pom文件控制台运行jar命令运行maven工程读取resources配置文件的姿势maven项目结构如下maven项目读取配置文件信息...
    99+
    2022-11-12
  • java maven项目怎么读取配置文件信息
    这篇文章给大家分享的是有关java maven项目怎么读取配置文件信息的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。maven项目读取配置文件信息目录结构主类App.javapackage com.to...
    99+
    2023-06-25
  • Java实现给Word文件添加文字水印
    目录方法思路Jar引入Java代码Word中设置水印时,可预设的文字或自定义文字设置为水印效果,但通常添加水印效果时,会对所有页面都设置成统一效果,如果需要对每一页或者某个页面设置不...
    99+
    2022-11-13
  • C#中怎么读取文件内容并实现另存
    这篇文章给大家介绍C#中怎么读取文件内容并实现另存,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。代码的实现:using System;  using System.Data;&n...
    99+
    2023-06-18
  • 如何实现一个读取xml文件内容的类
    这篇文章将为大家详细讲解有关如何实现一个读取xml文件内容的类,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。一个读取xml文件内容的类 package project.util.xml;import ja...
    99+
    2023-06-03
  • Java如何不解压读取.zip的文件内容
    前言 最近项目中需要拿到.zip文件中的文件内容,之前的做法是先解压到某个目录然后在对里面的文件进行处理,后面发现其实可以不用这么做,jdk中自带的包就可以解决这个问题。 示例如下:...
    99+
    2022-11-11
  • 详解Java无需解压直接读取Zip文件和文件内容
    整理文档,搜刮出一个Java无需解压直接读取Zip文件和文件内容的代码,稍微整理精简一下做下分享。package test;import java.io.BufferedInputStream; import java.io.Buffere...
    99+
    2023-05-31
    java zip ava
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作