首页 > 资讯 > 后端开发 > Python >python利用pytesseract快速识别提取图片中的文字((图片识别)

355

分享到

python利用pytesseract快速识别提取图片中的文字((图片识别)

python pytesseract识别图片文字 python pytesseract提取图片文字 python pytesseract图片中文字 2022-11-13 19:11:28 355人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

目录前言一、配置环境1. 安装python依赖2. 安装识别引擎二、使用步骤1.引入库2.提取图片文字3.运行效果总结提示：本文多图，请手机端注意流量。前言利用Python做图

前言

利用Python做图片识别，识别提取图片中的文字会有很多方法，但是想要简单一点怎么办，那就可以使用tesseract识别引擎来实现，一行代码就可以做到提取图片文本。

一、配置环境

1. 安装python依赖

本程序用到了两个python库，pytesseract和PIL，所以先来安装。

运行以下命令

pip install Pillow
pip install pytesseract

如果在python中没有报错，说明程序安装成功，

2. 安装识别引擎

安装完以上两个依赖还需要对应的识别引擎。点击去下载

咱们直接使用5月10号构建的最新版本。

安装tesseract识别引擎（可跳过）

下载完成后打开程序进行安装，先选择语言，这里选择英语English就行，然后点ok

接下来就是next，完了点击I Agree同意协议，

为所有用户安装，然后点next，如图，

接下来安装中文的语言包用来识别中文，需要滑到下面，选择中文，我这里横排简体中文和竖排简体中文都选择了，完成后点击next，

选择安装路径，建议安装到C盘以外，然后点击next

这里点击安装install，

等待安装完成

安装完成后，点击next，再点击finish完成安装，

验证是否安装成功

添加环境变量，就是你安装到的那个文件夹路径，直接加到path里面，

然后在命令行运行tesseract -v，如果和下图一样，说明你已经安装成功了，

二、使用步骤

1.引入库

from PIL import Image
import pytesseract

2.提取图片文字

将读取图片的一行代码封装为一个函数，

def read_image(name):
    print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))

在main函数中直接调用即可，

def main():
    read_image('1657158527412.jpg')

3.运行效果

以以下图片为例，

运行效果如下，

总结

本文介绍了tesseract的python调用，也就是pytesseract库，其中还有一些其他的内容并没有涉及，仅涉及到了图片提取文字，如果你对其感兴趣，可以深入探索一下，也希望能和我探讨一下。

完整代码

from PIL import Image
import pytesseract
def read_image(name):
    print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
def main():
    read_image('img.png')
if __name__ == '__main__':
    main()

到此这篇关于python利用 pytesseract快速识别提取图片中的文字( 图片识别)的文章就介绍到这了,更多相关python pytesseract识别图片文字内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: python利用pytesseract快速识别提取图片中的文字((图片识别)

本文链接: https://www.lsjlt.com/news/171175.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

python利用pytesseract快速识别提取图片中的文字((图片识别)

目录前言一、配置环境1. 安装python依赖2. 安装识别引擎二、使用步骤1.引入库2.提取图片文字3.运行效果总结提示：本文多图，请手机端注意流量。前言利用python做图...

99+

2022-11-13

python pytesseract识别图片文字 python pytesseract提取图片文字 python pytesseract图片中文字
【Python • 图片识别】pytesseract快速识别提取图片中的文字

提示：本文多图，请手机端注意流量。文章目录前言一、配置环境1. 安装python依赖2. 安装识别引擎安装tesseract识别引擎`（可跳过）`验证是否安装成功二、使...

99+

2023-09-10

python 开发语言
通过Python的pytesseract库识别图片中的文字

文章目录前言一、pytesseract1.pytesseract是什么？2.安装pytesseract3.查看pytesseract版本4.安装PIL5.查看PIL版本二、Tesser...

99+

2023-09-12

python 人工智能计算机视觉图像处理
Python通过pytesseract库实现识别图片中的文字

目录前言一、pytesseract1.pytesseract是什么2.安装pytesseract3.查看pytesseract版本4.安装PIL5.查看PIL版本二、Tesserac...

99+

2023-05-19

Python pytesseract识别图片中文字 Python pytesseract识别文字 Python pytesseract
如何利用Python识别图片中的文字

这篇文章将为大家详细讲解有关如何利用Python识别图片中的文字，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。一、Tesseract文字识别是ORC的一部分内容，ORC的意思是光学字符识别，通俗讲就是文字...

99+

2023-06-15
Python基于百度API识别并提取图片中文字

利用百度 AI 开发平台的 OCR 文字识别 API 识别并提取图片中的文字。首先需注册获取 API 调用的 ID 和 key，步骤如下：打开百度AI开放平台，进入控制台中的文字识...

99+

2022-11-12
如何利用Python识别图片中的文字详解

一、Tesseract 文字识别是ORC的一部分内容，ORC的意思是光学字符识别，通俗讲就是文字识别。Tesseract是一个用于文字识别的工具，我们结合Python使用可以很快的实...

99+

2022-11-12
使用python进行图片的文字识别

使用python进行图片的文字识别文章目录使用python进行图片的文字识别安装 Tesseract OCR安装过程配置系统的环境变量安装python的第三方库Pytesserac...

99+

2023-09-08

python windows pytesseract Tesseract ORC
Python 图片文字识别的实现之PaddleOCR

目录项目使用项目结构环境部署1、安装Anaconda，构造虚拟环境2、依赖包下载测试代码参数补充总结前言什么是OCR? 光学字符识别（Optical Character R...

99+

2022-11-12
C#.NET实现扫描识别图片中的文字

目录环境配置操作步骤调用API接口扫描并读取图片中的文字C#VB.NET注意事项环境配置本文以C#及VB.NET代码为例，介绍如何扫描并读取图片中的文字。本次程序环境如下： ...

99+

2022-11-12
Python实现识别图片为文字的示例代码

目录1、环境准备2、业务实现3、效果展示本来想着做一个将图片识别为文字的小功能，本想到Google上面第一页全是各种收费平台的广告。这些平台提供的基本都是让我们通过调用相关的三方接...

99+

2022-11-11
python常用的OCR文字识别与图片定位方式

python常用的OCR文字识别与图片定位方式前言统一版本更换pip源 1. Python调用百度文字识别ocr的实现方式1.1 使用PyCharm安装依赖baidu-aipcharde...

99+

2023-09-02

python pycharm 开发语言
C# .NET如何实现扫描识别图片中的文字

C# .NET如何实现扫描识别图片中的文字，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。环境配置本文以C#及VB.NET代码为例，介绍如何扫描并读取图片中的文字。...

99+

2023-06-22
使用Python中的pytesseract模块实现抓取图片中文字

目录一、需求分析二、方案选择三、实验实操3.1、配置环境3.2、 Anaconda配置3.3、安装tesseract程序3.4、安装pytesseract模块3.5、见证奇迹的环节一...

99+

2022-11-13

Python pytesseract模块抓取图片中文字 Python pytesseract图片文字 python识别图片文字
python基于OpenCV模板匹配识别图片中的数字

目录前言程序目标思路讲解代码讲解完整代码总结前言本博客主要实现利用OpenCV的模板匹配识别图像中的数字，然后把识别出来的数字输出到txt文件中，如果识别失败则输出“读取失败”。...

99+

2022-11-12
Java使用Tessdata做OCR图片文字识别的详细思路

说到文字识别，目前除了用一些现成的api，大概就是 tessdata、canvas或者 ocrad等。 1、百度接口用过（可以自己去百度开发者申请，免费的），识别率吧，还可以，但也不...

99+

2022-11-12
怎么在Python中使用Opencv识别相似的图片

这篇文章给大家介绍怎么在Python中使用Opencv识别相似的图片，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。python主要应用领域有哪些1、云计算，典型应用OpenStack。2、WEB前端开发，众多大型网站均...

99+

2023-06-14
Python调用百度AI实现图片上文字识别功能实例

目录简介步骤安装百度AI库注册百度AI开放平台调用glob库调用AipOcr库识别文字可能会遇到的问题批量操作总结简介 Python免费调用百度AI实现图片上面的文字识别步骤安装...

99+

2022-11-12
如何在java项目中利用ocr实现一个图片文字识别功能

这期内容当中小编将会给大家带来有关如何在java项目中利用ocr实现一个图片文字识别功能，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。最近在开发的时候需要识别图片中的一些文字，网上找了相关资料之后，发现g...

99+

2023-05-31

java ocr ava
python如何基于OpenCV模板匹配识别图片中的数字

小编给大家分享一下python如何基于OpenCV模板匹配识别图片中的数字，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！程序目标单个数字模板：（这些单个模板是我自...

99+

2023-06-14