首页 > 资讯 > 后端开发 > Python >python常用的OCR文字识别与图片定位方式

247

分享到

python常用的OCR文字识别与图片定位方式

python pycharm 开发语言 2023-09-02 06:09:48 247人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

python常用的OCR文字识别与图片定位方式前言统一版本更换pip源 1. Python调用百度文字识别ocr的实现方式1.1 使用PyCharm安装依赖baidu-aipcharde

python常用的OCR文字识别与图片定位方式

前言
- 统一版本
- 更换pip源
1. Python调用百度文字识别ocr的实现方式
2. Python实现图片匹配与定位
3.python调用PaddleOCR

前言

统一版本

如果想一次性调用成功，最好与本教程所用的版本保持一致

Python版本：3.10
PyCharm版本：PyCharm 2022.1.2

更换pip源

平常使用python自带的pip进行安装是比较慢的，该处推荐几个自己用着比较快的源，可以进行替换

百度源： https://mirror.baidu.com/pypi/simple
清华大学：Https://pypi.tuna.tsinghua.edu.cn/simple/

如果使用的是命令窗口的形式，只需要在安装的包名后面添加个 -i https://mirror.baidu.com/pypi/simple即可，如下所示

pip install paddlepaddle==2.4.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

如果使用的是PyCharm

在左下角找到Python Packages
2点击设置按钮
3.起个名字
4.输入源
5.点击确定
6.此时PyCharm中的源添加完毕，在使用Python Interpreter的时候，即可选择对应的源进行下载，提高下载速度

按照如图所示即可
在这里插入图片描述

1. Python调用百度文字识别ocr的实现方式

1.1 使用PyCharm安装依赖

首先，使用PyCharm创建好一个项目，设置如图所示
在这里插入图片描述

使用PyCharm创建完成一个项目后，开始安装必要的插件，本案例使用的是Python Interpreter。
路径为File–>Settings–>Project:你的项目名称–>Python Interpreter
如下图所示，备注：示例中是已经安装后的，如果是首次创建，则只有三个包

在这里插入图片描述
开始安装运行所需要的依赖

baidu-aip

版本为4.16.8
点击图中红框中的 + 号
在这里插入图片描述
在搜索框中，输入要安装的包名，选择合适的源（此处请参考前言中的更换pip源,如果未添加其他的源，则只显示一个baidu-aip）进行下载，如图所示，可以选择版本，确定好版本后，点击下面的Install Package进行安装即可。接下来的包安装与该方式相同，如果有其他包安装的话，不再进行截图，下载方式参考该处即可
在这里插入图片描述

chardet

具体安装详情请参考baidu-api,版本为5.1.0

1.2 代码实现

准备工作

需求自己先在百度工作台上找到对应的APP_ID 、API_KEY 、SECRET_KEY
具体怎么找请自行百度

经过前面的步骤，已经安装了启动代码所需要的依赖，此时，把该代码复制到自己的项目中，稍作修改即可

import os.pathfrom aip import AipOcrif __name__ == '__main__':    """ 你的 APPID AK SK """    APP_ID = '你的APP_ID'    API_KEY = '你的API_KEY '    SECRET_KEY = '你的SECRET_KEY '    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)       """ 相对路径，在项目跟路径下，创建个img文件夹，然后文件夹中有个zhuogui.png图片，用来进行测试是否可用 """    img_dir_path = r'img'    imagepath = os.path.join(img_dir_path, 'zhuogui.png')    with open(imagepath, 'rb') as fp:        """识别到信息以字典形式返回"""        dic = client.general(fp.read())        print(dic)        """遍历字典与想要的文案对比如果对比到就返回坐标"""    exit(0)

1.3 运行结果展示

效果如下图所示
在这里插入图片描述

2. Python实现图片匹配与定位

该实现方式适用于以下场景：
如给定一张小图片，判断该图片是否在另一张图片中；或者在一张大图片中，截出来一小部分图片，然后定位该图片在大图中的位置

2.1 安装依赖

在运行项目前，需要先安装如下依赖，具体安装方式，请参考标题1中的baidu-aip的方式进行安装

aircv

版本为1.4.6

OpenCV-python

版本为4.6.0.66

2.2 python代码实现

import aircv as ac# Press the green button in the gutter to run the script.if __name__ == '__main__':    # 源文件，要在该图片中进行查找,被注释的方式为java传参   # imsrc = ac.imread(sys.argv[1])    imsrc = ac.imread('D:\code\yujian\yujian-admin\src\main\\resources\static\image\coordinate.png')    # 查找的图标，需要查找的图标,被注释的方式为java传参   # imobj = ac.imread(sys.argv[2])    imobj = ac.imread('D:\code\yujian\yujian-admin\src\main\\resources\static\image\c0002.png')    # {'confidence': 0.5435812473297119, 'rectangle': ((394, 384), (394, 416), (450, 384), (450, 416)), 'result': (422.0, 400.0)    # confidence：匹配相似率    # rectangle：匹配图片在原始图像上四边形的坐标    # result：匹配图片在原始图片上的中心坐标点，也就是我们要找的点击点    # similarity = ac.imread(sys.argv[3])    # match_result = ac.find_template(imsrc, imobj, 0.70)    match_result = ac.find_template(imsrc, imobj, 0.70)    if match_result is not None:        match_result['shape'] = (imsrc.shape[1], imsrc.shape[0])  # 0为高，1为宽    print(match_result);

2.3 运行结果展示

如下图所示，返回小图片在大图片中的坐标位置
在这里插入图片描述

3.python调用PaddleOCR

详细信息，可去飞桨官网进行查看,本教程只介绍简单的使用与安装

3.1 安装依赖

在运行项目前，需要先安装如下依赖，具体安装方式，请参考标题1中的baidu-aip的方式进行安装

paddlepaddle

版本为2.4.1

paddleocr

版本为2.6.1.2

备注：
1.安装包较大，时间较长，PyCharm导入时间也长，耐心等待即可
2. 安装完成后，可以先看下numpy包的版本，如果是1.24.0，则更换为1.23.2即可，否则运行时会报错

3.2 python中的代码

import osfrom paddleocr import PaddleOCRimport cv2from math import *import numpy as npdef img_match(img_address):ocr = PaddleOCR(use_angle_cls=False, lang="ch", use_gpu=False)# 该处注释掉了其他的字库，如果需要下面的字库，可在GitHub上自行下载，该教材以上面的简单字库为例，复制即用    #ocr = PaddleOCR(use_angle_cls=True, lang="ch",    #               rec_model_dir='../models/ch_PP-OCRv3_rec_slim_infer/',    #               cls_model_dir='../models/ch_ppocr_mobile_v2.0_cls_slim_infer/',    #               det_model_dir='../models/ch_PP-OCRv3_det_slim_infer/')    src_img = cv2.imread(img_address)    h, w = src_img.shape[:2]    big = int(sqrt(h * h + w * w))    big_img = np.empty((big, big, src_img.ndim), np.uint8)    yoff = round((big - h) / 2)    xoff = round((big - w) / 2)    big_img[yoff:yoff + h, xoff:xoff + w] = src_img    # 文字识别    matRotate = cv2.getRotationMatrix2D((big * 0.5, big * 0.5), 0, 1)    dst = cv2.warpAffine(big_img, matRotate, (big, big))    result = ocr.ocr(dst, cls=True)    results = ""    for text in result:        for value in text:            results = results + str(value[1])    print(results)if __name__ == '__main__':    img_dir_path = r'img'    imagepath = os.path.join(img_dir_path, 'zhuogui.png')    img_match(imagepath)    # 此处可以更换成字符串的绝对路径，如果更换为绝对路径的话，上面三行需要删除    # img_match("G:\\360MoveData\\Users\\86177\\Desktop\\zhuogui.png")

3.3 执行结果

正确执行结果如下（如果执行的时候报错，请看3.4 运行报错（所踩的坑））
在这里插入图片描述

3.4 运行报错（所踩的坑）

如果遇到该报错，请查看安装的依赖的numpy，更换成1.23.2即可
在这里插入图片描述

在这里插入图片描述

来源地址：https://blog.csdn.net/pan840060711/article/details/128401473

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: python常用的OCR文字识别与图片定位方式

本文链接: https://www.lsjlt.com/news/389999.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

python常用的OCR文字识别与图片定位方式

python常用的OCR文字识别与图片定位方式前言统一版本更换pip源 1. Python调用百度文字识别ocr的实现方式1.1 使用PyCharm安装依赖baidu-aipcharde...

99+

2023-09-02

python pycharm 开发语言
Java如何使用Tessdata做OCR图片文字识别

这篇文章主要介绍“Java如何使用Tessdata做OCR图片文字识别”，在日常操作中，相信很多人在Java如何使用Tessdata做OCR图片文字识别问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Java如...

99+

2023-06-20
Java使用Tessdata做OCR图片文字识别的详细思路

说到文字识别，目前除了用一些现成的api，大概就是 tessdata、canvas或者 ocrad等。 1、百度接口用过（可以自己去百度开发者申请，免费的），识别率吧，还可以，但也不...

99+

2024-04-02
如何使用Python实现图像文字识别OCR

要使用Python实现图像文字识别OCR，可以使用以下步骤：安装Tesseract OCR引擎 Tesseract是一种开源OCR引擎，可以处理多种语言和字体。要使用Python进行OCR，需要安装Tesseract OCR引擎。安装...

99+

2023-09-09

python opencv 计算机视觉 Powered by 金山文档
python调用文字识别OCR轻松搞定验证码

今天带你们去研究一个有趣的东西，文字识别OCR。不知道你们有没有想要识别图片，然后读出文字的功能。例如验证码，如果需要自动填写的话就需要这功能。还有很多种情况需要这功能的。我们可...

99+

2024-04-02
【Python • 图片识别】pytesseract快速识别提取图片中的文字

提示：本文多图，请手机端注意流量。文章目录前言一、配置环境1. 安装python依赖2. 安装识别引擎安装tesseract识别引擎`（可跳过）`验证是否安装成功二、使...

99+

2023-09-10

python 开发语言
python利用pytesseract快速识别提取图片中的文字((图片识别)

目录前言一、配置环境1. 安装python依赖2. 安装识别引擎二、使用步骤1.引入库2.提取图片文字3.运行效果总结提示：本文多图，请手机端注意流量。前言利用python做图...

99+

2022-11-13

python pytesseract识别图片文字 python pytesseract提取图片文字 python pytesseract图片中文字
如何用Python实现图像文字识别OCR工具

这篇文章主要介绍“如何用Python实现图像文字识别OCR工具”，在日常操作中，相信很多人在如何用Python实现图像文字识别OCR工具问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”如何用Python实现图像...

99+

2023-06-22
使用python进行图片的文字识别

使用python进行图片的文字识别文章目录使用python进行图片的文字识别安装 Tesseract OCR安装过程配置系统的环境变量安装python的第三方库Pytesserac...

99+

2023-09-08

python windows pytesseract Tesseract ORC
如何利用Python识别图片中的文字

这篇文章将为大家详细讲解有关如何利用Python识别图片中的文字，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。一、Tesseract文字识别是ORC的一部分内容，ORC的意思是光学字符识别，通俗讲就是文字...

99+

2023-06-15
Python 图片文字识别的实现之PaddleOCR

目录项目使用项目结构环境部署1、安装Anaconda，构造虚拟环境2、依赖包下载测试代码参数补充总结前言什么是OCR? 光学字符识别（Optical Character R...

99+

2024-04-02
如何利用Python识别图片中的文字详解

一、Tesseract 文字识别是ORC的一部分内容，ORC的意思是光学字符识别，通俗讲就是文字识别。Tesseract是一个用于文字识别的工具，我们结合Python使用可以很快的实...

99+

2024-04-02
通过Python的pytesseract库识别图片中的文字

文章目录前言一、pytesseract1.pytesseract是什么？2.安装pytesseract3.查看pytesseract版本4.安装PIL5.查看PIL版本二、Tesser...

99+

2023-09-12

python 人工智能计算机视觉图像处理
如何在java项目中利用ocr实现一个图片文字识别功能

这期内容当中小编将会给大家带来有关如何在java项目中利用ocr实现一个图片文字识别功能，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。最近在开发的时候需要识别图片中的一些文字，网上找了相关资料之后，发现g...

99+

2023-05-31

java ocr ava
Python通过pytesseract库实现识别图片中的文字

目录前言一、pytesseract1.pytesseract是什么2.安装pytesseract3.查看pytesseract版本4.安装PIL5.查看PIL版本二、Tesserac...

99+

2023-05-19

Python pytesseract识别图片中文字 Python pytesseract识别文字 Python pytesseract
Python实现识别图片为文字的示例代码

目录1、环境准备2、业务实现3、效果展示本来想着做一个将图片识别为文字的小功能，本想到Google上面第一页全是各种收费平台的广告。这些平台提供的基本都是让我们通过调用相关的三方接...

99+

2024-04-02
Python调用百度AI实现图片上文字识别功能实例

目录简介步骤安装百度AI库注册百度AI开放平台调用glob库调用AipOcr库识别文字可能会遇到的问题批量操作总结简介 Python免费调用百度AI实现图片上面的文字识别步骤安装...

99+

2024-04-02
web开发中图片上添加文字的两种常用方式

本篇文章为大家展示了web开发中图片上添加文字的两种常用方式，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。 1.常用的方式是：将一张图...

99+

2024-04-02
三种利用python将html文件转图片的方式

pyecharts的表格组件Table生成的html文件转图片方式工作中由python处理后的数据需要自动化发送到工作群组第一种：pyecharts自带的snapshot_phantomjs...

99+

2023-10-23

python 开发语言
Python使用正则表达式识别代码中的中文、英文和数字实例演示

Python 正则表达式识别代码中的中文、英文和数字识别中文识别英文识别数字拓展在文本处理和数据分析中，有时候需要从代码中提取出其中包含的中文、英文和数字信息。正则表达式是一种强大的工...

99+

2023-09-09

python 正则表达式开发语言