iis服务器助手广告广告
返回顶部
首页 > 资讯 > 操作系统 >apache tika检测文件是否损坏的方法
  • 423
分享到

apache tika检测文件是否损坏的方法

apachetika检测文件 2022-06-04 23:06:50 423人浏览 安东尼
摘要

Apache Tika用于文件类型检测和从各种格式的文件内容提取的库。 将上传文件至服务器,进行解析文件时,经常需要判断文件是否损坏。我们可以使用tika来检测文件是否损坏 Maven引入如下: <depend

Apache Tika用于文件类型检测和从各种格式的文件内容提取的库。

将上传文件至服务器,进行解析文件时,经常需要判断文件是否损坏。我们可以使用tika来检测文件是否损坏

Maven引入如下:


&lt;dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-app</artifactId>
  <version>1.18</version>
</dependency>
<dependency>
  <groupId>xerces</groupId>
  <artifactId>xercesImpl</artifactId>
  <version>2.11.0</version>
</dependency>

  如果jar包冲突时可以引入如下:


<dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-core</artifactId>
  <version>1.18</version>
</dependency>
<dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-parsers</artifactId>
  <version>1.18</version>
</dependency>
<dependency>
  <groupId>xerces</groupId>
  <artifactId>xercesImpl</artifactId>
  <version>2.11.0</version>
</dependency>

使用tika检测文件是否损坏: 

  如果从输入流读取失败,则parse方法抛出IOException异常,从流中获取的文档不能被解析抛TikaExceptQXRvwyOion异常,处理器不能处理事件则抛SAXException异常

  当文档不能被解析时,说明文档损坏

执行过程:


public static void main(String[] args) {
    try {
      //Assume sample.txt is in your current directory
      File file = new File("D:\\测试.txt");
      boolean result = isParseFile(file);
    } catch (Exception e) {
      e.printStackTrace();
    }
  }
 
  
  private static boolean isParseFile(File file) throws Exception {
    try {
      Tika tika = new Tika();
      String filecontent = tika.parseToString(file);
      System.out.println(filecontent);
      return true;
    } catch (TikaException e) {
      return false;
    }
  }

  输出结果:

测试数据---读取文本内容

总结

以上所述是小编给大家介绍的apache tika检测文件是否损坏的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

--结束END--

本文标题: apache tika检测文件是否损坏的方法

本文链接: https://www.lsjlt.com/news/20588.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • mac提示文件已损坏的处理方法
      用户在使用mac系统安装或下载一些软件应用时,偶尔会出现“XXX软件已损坏”的情况,下面就来教大家遇到这种情况怎么解决:       1、MacOS 10.15及以上新系统出现应用提示损坏打不开的解决方法:       打开终端(屏...
    99+
    2023-09-03
    macos
  • shell检测某个文件/文件夹是否存在
    1、shell检测某一文件是否存在 当你在shell中需要检查一个文件是否存在时,通常需要使用到文件操作符-e和-f。第一个-e用来检查文件是否存在,而不管文件类型。第二个-f仅仅用来检查文件是常规文件(不是目录或设备)时返回true。 F...
    99+
    2023-08-31
    linux 运维 服务器
  • ppt文件损坏修复无法读取的解决方法
    这篇文章将为大家详细讲解有关ppt文件损坏修复无法读取的解决方法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。解决方法:首先点击顶部导航栏的“文件”选项卡,在下拉列表里选择“选项”;然后找到“信任中心”,...
    99+
    2023-06-14
  • nodejs如何检测文件是否存在
    这篇文章将为大家详细讲解有关nodejs如何检测文件是否存在,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。 检测方法:1、使用“fs.exis...
    99+
    2024-04-02
  • gzip压缩文件底层结构及文件损坏的修复方法是什么
    本文小编为大家详细介绍“gzip压缩文件底层结构及文件损坏的修复方法是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“gzip压缩文件底层结构及文件损坏的修复方法是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知...
    99+
    2023-06-04
  • Linux文件系统损坏原因及修复方法
    本篇内容主要讲解“Linux文件系统损坏原因及修复方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Linux文件系统损坏原因及修复方法”吧!有时候维护Linux服务器时会面临这样一种错误,即显...
    99+
    2023-06-13
  • 修复损坏的Word文档的三种方法
    修复损坏的Word文档的三种方法包括:1. 使用Microsoft Office内置的修复工具:打开损坏的Word文档时,Micro...
    99+
    2023-09-16
    Word
  • JavaScript 检测文件的类型的方法
    目录一、如何查看图片的二进制数据二、如何区分图片的类型三、如何检测图片的类型3.1 定义 readBuffer 函数3.2 定义 check 函数3.3 检测 PNG 图片类型我们会...
    99+
    2024-04-02
  • ORACLE检查找出损坏索引(Corrupt Indexes)的方法详解
    索引 索引与表一样,也属于段(segment)的一种。里面存放了用户的数据,跟表一样需要占用磁盘空间。索引是一种允许直接访问数据表中某一数据行的树型结构,为了提高查询效率而引入,是一个独立于表的对象,可以存...
    99+
    2024-04-02
  • Win8文件损坏无法自动修复的尝试解决方法
    一、检查映像是否可修复 1.扫描映像来检查损坏。在管理员命令提示符下键入以下命令: Dism /Online /Cleanup-Image /ScanHealth 这条命令将扫描全部系统文件并和官方系统文件对比,扫描计算...
    99+
    2023-06-04
    Win8 文件损坏 自动修复 解决 尝试 文件 方法
  • php检测变量是否为空的方法是什么
    在 PHP 中,可以使用以下方法来检测变量是否为空: 使用 empty() 函数:empty() 函数可以检测变量是否为空,如果变...
    99+
    2024-03-06
    php
  • SpringBoot下载Excel文件时,报错文件损坏的解决方案
    SpringBoot下载Excel文件文件损坏 我把模板文件放在了resources目录下 maven插件打包项目的时候,默认会压缩resources目录下的文件。 服务器读取的文...
    99+
    2024-04-02
  • 使用系统文件检查器工具修复丢失或损坏的系统文件
    使用系统文件检查器工具修复丢失或损坏的系统文件是一个常见的系统维护操作。下面是在不同操作系统中使用系统文件检查器工具修复丢失或损坏的...
    99+
    2023-09-08
    系统文件
  • 脚本批量检测网站是否存活的方法
    小编给大家分享一下脚本批量检测网站是否存活的方法,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧! 脚本内容编写如下:#!/bin/bashurl=(www.baid...
    99+
    2023-06-09
  • node中fs模块如何检测文件是否存在
    这篇文章主要介绍node中fs模块如何检测文件是否存在,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!检测方法:1、使用“const fs = require("fs&quo...
    99+
    2024-04-02
  • 计算机中解压zip显示文件已损坏的解决方法
    这篇文章将为大家详细讲解有关计算机中解压zip显示文件已损坏的解决方法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。解决方法:1、双击打开已损坏的压缩包,点击页面顶部的“工具”选项卡选择“修复压缩文件”即...
    99+
    2023-06-15
  • 计算机中win10文件或目录损坏无法读取的解决方法
    这篇文章主要介绍计算机中win10文件或目录损坏无法读取的解决方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!win10系统文件或目录损坏且无法读取出现错误代码0x80070570怎么办?在复制文件的时候...
    99+
    2023-06-10
  • win7 CRC校验错误 文件已损坏的修复办法
    更急人的是找了几个下载点下下来的都是一样的东西。难道这次又要出钱去买了到先前那个买过课程的网站上去看了一下 ,还找不到那门课程,其他网站又太贵。哎!难道免费午餐和廉价午餐都没有了绝望之余,到论坛上发帖求助,有一位热心网友...
    99+
    2023-05-25
    win7 CRC校验错误 校验 CRC 办法 修复
  • 服务器硬件检测方法是什么
    服务器硬件检测方法:1、检查服务器的硬件可以检查服务器中CPU、内存、硬盘、光驱、显卡等部件,以确保它们是否正常工作。2、运行系统负...
    99+
    2023-03-11
    服务器硬件检测 服务器
  • php检查类方法是否存在的方法
    这篇文章主要讲解了“php检查类方法是否存在的方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“php检查类方法是否存在的方法”吧!php检查类方法是否存在的方法是,使用method_exi...
    99+
    2023-06-20
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作