iis服务器助手广告广告
返回顶部
首页 > 资讯 > 精选 >如何在Java项目中使用OCR tesseract实现一个图文识别功能
  • 135
分享到

如何在Java项目中使用OCR tesseract实现一个图文识别功能

javaocrtesseractava 2023-05-31 11:05:53 135人浏览 独家记忆
摘要

如何在Java项目中使用OCR tesseract实现一个图文识别功能?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。代码:package com.zhy.test; im

如何在Java项目中使用OCR tesseract实现一个图文识别功能?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

代码:

package com.zhy.test;  import java.io.BufferedReader;  import java.io.File; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.List;  import org.jdesktop.swingx.util.OS;  public class OCRHelper {  private final String LANG_OPTION = "-l";  private final String EOL = System.getProperty("line.separator");    private String tessPath = new File("tesseract").getAbsolutePath();     public String recognizeText(File imageFile) throws Exception  {      File outputFile = new File(imageFile.getParentFile(), "output");    StringBuffer strB = new StringBuffer();   List<String> cmd = new ArrayList<String>();   if (OS.iswindowsXP())   {    cmd.add(tessPath + "\\tesseract");   } else if (OS.islinux())   {    cmd.add("tesseract");   } else   {    cmd.add(tessPath + "\\tesseract");   }   cmd.add("");   cmd.add(outputFile.getName());   cmd.add(LANG_OPTION); //  cmd.add("chi_sim");   cmd.add("eng");    ProcessBuilder pb = new ProcessBuilder();      pb.directory(imageFile.getParentFile());   cmd.set(1, imageFile.getName());   pb.command(cmd);   pb.redirectErrorStream(true);   Process process = pb.start();   // tesseract.exe 1.jpg 1 -l chi_sim   // Runtime.getRuntime().exec("tesseract.exe 1.jpg 1 -l chi_sim");    //  System.out.println(cmd.toString());   int w = process.waitFor();   if (w == 0)// 0代表正常退出   {    BufferedReader in = new BufferedReader(new InputStreamReader(      new FileInputStream(outputFile.getAbsolutePath() + ".txt"),      "UTF-8"));    String str;     while ((str = in.readLine()) != null)    {     strB.append(str).append(EOL);    }    in.close();   } else   {    String msg;    switch (w)    {    case 1:     msg = "Errors accessing files. There may be spaces in your image's filename.";     break;    case 29:     msg = "Cannot recognize the image or its selected region.";     break;    case 31:     msg = "Unsupported image fORMat.";     break;    default:     msg = "Errors occurred.";    }    throw new RuntimeException(msg);   }   new File(outputFile.getAbsolutePath() + ".txt").delete();   return strB.toString().replaceAll("\\s*", "");  } } 

--结束END--

本文标题: 如何在Java项目中使用OCR tesseract实现一个图文识别功能

本文链接: https://www.lsjlt.com/news/225373.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作