小白学Python之实现OCR识别

python实现ocr识别算法 python结合ocr python ocr 识别开源 2022-06-02 23:06:54 929人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

目录前期准备界面编写截图功能实现OCR实现内容显示总结前期准备在这个阶段主要准备整个小程序的结构，既然要实现ocr，那么输入就是一张图片，而图片这里采用屏幕截图的方式获得，输出是文字，这里采用搜狗的ocr接口，我

前期准备

在这个阶段主要准备整个小程序的结构，既然要实现ocr，那么输入就是一张图片，而图片这里采用屏幕截图的方式获得，输出是文字，这里采用搜狗的ocr接口，我们把截好的图片传到搜狗ocr接口中，然后把返回的文字作为输出即可。

由于想做一个小程序，所以要为程序做GUI，这里采用tkinter编制GUI界面。

界面编写

界面主要就准备一个窗体，里面有菜单，给出OCR功能。

之后我们点击菜单，则启动一个截图功能，在截图完成后，我们就把截得的图片传入ocr接口并返回文字到主窗体中。

主面板的编写则直接使用tkinter建立菜单等


	root = Tk() 
	root.title("小新的OCR")
	# 创建一个顶级菜单
    menubar = Menu(root)
    # 创建一个下拉菜单“文件”，然后将它添加到顶级菜单中
    filemenu = Menu(menubar, tearoff=False)
    filemenu.add_command(label="OCR", command=buttonCaptureClick, accelerator='Ctrl+N')
    filemenu.add_command(label="帮助",command=helpClick)
    filemenu.add_command(label="退出", command=root.quit)
    menubar.add_cascade(label="操作", menu=filemenu)
    # 显示菜单
    root.config(menu=menubar)
    root.bind_all("<Control-d>", lambda event: buttonCaptureClick())
    #启动消息主循环
    root.mainloop()

这样变回产生一个窗体，用户可以和这个窗体进行交互，你可以点击菜单，然后找到其子菜单中的OCR一项，点击它便会调用一个buttonCaptureClick的函数，这个函数就来产生截图，并且保存截图。

截图功能实现

截图功能我也是参考网上的内容，原理就是先把整个屏幕给捕捉到，然后监听鼠标事件，当鼠标左边按下则作为截图的左顶点，鼠标左键松下则最为截图的右底点，这样我们截图区域就出来了，然后进行保存即可。


#用来显示全屏幕截图并响应二次截图的窗口类
class MyCapture:
    def __init__(self, png):
        #变量X和Y用来记录鼠标左键按下的位置
        self.X = tkinter.IntVar(value=0)
        self.Y = tkinter.IntVar(value=0)
        #屏幕尺寸
        screenWidth = root.winfo_screenwidth()
        screenHeight = root.winfo_screenheight()
        #创建顶级组件容器
        self.top = tkinter.Toplevel(root, width=screenWidth, height=screenHeight)
        #不显示最大化、最小化按钮
        self.top.overrideredirect(True)
        self.canvas = tkinter.Canvas(self.top,bg='white', width=screenWidth, height=screenHeight)
        #显示全屏截图，在全屏截图上进行区域截图
        self.image = tkinter.PhotoImage(file=png)
        self.text =""
        self.canvas.create_image(screenWidth//2, screenHeight//2, image=self.image)
        #鼠标左键按下的位置
        def onLeftButtonDown(event):
            self.X.set(event.x)
            self.Y.set(event.y)
            #开始截图
            self.sel = True
        self.canvas.bind('<Button-1>', onLeftButtonDown)
        #鼠标左键移动，显示选取的区域
        def onLeftButtonMove(event):
            if not self.sel:
                return
            global lastDraw
            try:
                #删除刚画完的图形，要不然鼠标移动的时候是黑乎乎的一片矩形
                self.canvas.delete(lastDraw)
            except Exception as e:
                pass
            lastDraw = self.canvas.create_rectangle(self.X.get(), self.Y.get(), event.x, event.y, outline='black')
        self.canvas.bind('<B1-Motion>', onLeftButtonMove)
        #获取鼠标左键抬起的位置，保存区域截图
        def onLeftButtonUp(event):
            self.sel = False
            try:
                self.canvas.delete(lastDraw)
            except Exception as e:
                pass
            sleep(0.1)
            #考虑鼠标左键从右下方按下而从左上方抬起的截图
            left, right = sorted([self.X.get(), event.x])
            top, bottom = sorted([self.Y.get(), event.y])
            pic = ImageGrab.grab((left+1, top+1, right, bottom))
            fileName ="temp.jpg"
            pic.save(fileName)
            self.text = get_text(fileName)
            #关闭当前窗口
            self.top.destroy()
        self.canvas.bind('<ButtonRelease-1>', onLeftButtonUp)
#让canvas充满窗口，并随窗口自动适应大小
        self.canvas.pack(fill=tkinter.BOTH, expand=tkinter.YES)
 #开始截图
def buttonCaptureClick():
    #最小化主窗口
#     root.state('icon')
    root.withdraw()
    sleep(0.4)
    filename = 'temp.png'
    #grab()方法默认对全屏幕进行截图
    im = ImageGrab.grab()
    im.save(filename)
    im.close()
    #显示全屏幕截图
    w = MyCapture(filename)
    root.wait_window(w.top)
    #截图结束，恢复主窗口，并删除临时的全屏幕截图文件
    root.update()
    root.deiconify()
    text1.config(state = NORMAL)
    text1.delete(0.0,END)
    text1.insert('insert',w.text)
    text1.config(state = DISABLED)
    text1.pack()
    os.remove(filename)

OCR实现

因为OCR其实是采用了搜狗的接口，所以需要做的工作也不是很多，只需要把我们的图片传入即可。


def get_text(img_path):
    print("")
    img = img_path # 图片路径
    files = {"pic_path": open(img, "rb")}  # files # 类似data数据
    url = "Http://pic.soGou.com/pic/upload_pic.jsp"  # post的url
    keyWords = requests.post(url, files=files).text  # requests 提交图片
    url = "http://pic.sogou.com/pic/ocr/ocrOnline.jsp?query=" + keywords  # keywords就是图片url此方式为get请求
    ocrResult = requests.get(url).JSON()  # 直接转换为json格式
    
    contents = ocrResult['result']  # 类似字典 把result的value值取出来 是一个list然后里面很多json就是识别的文字
    text = ""
    for content in contents:  # 遍历所有结果
        text+=(content['content'].strip()+'\n')  # strip去除空格 他返回的结果自带一个换行
    return text

内容显示

内容显示是在截图结束后我们把ocr识别的内容存储起来


self.text = get_text(fileName)

然后再显示到主窗体上


    text1.config(state = NORMAL)
    text1.delete(0.0,END)
    text1.insert('insert',w.text)
    text1.config(state = DISABLED)
    text1.pack()

总结

虽然是一个完整的项目，但是其中的很多模块其实都是借用其他人的模块，而我做的只是把他们结合起来做成一个小项目，所以是站在巨人的肩膀上开发。

到此这篇关于python实现OCR识别的文章就介绍到这了,更多相关Python实现OCR识别内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

参考：

https://cloud.tencent.com/developer/article/1097904
https://morvanzhou.GitHub.io/tutorials/python-basic/tkinter/
https://www.52pojie.cn/thread-708177-1-1.html

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 小白学Python之实现OCR识别

本文链接: https://www.lsjlt.com/news/11245.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

python之OCR文字识别

将图片翻译成文字一般被称为光学文字识别（Optical Character Recognition，OCR）。可以实现OCR 的底层库并不多，目前很多库都是使用共同的几个底层OCR 库，或者是在上面进...

99+

2023-09-05

python 深度学习开发语言
Python免费验证码识别之ddddocr识别OCR自动库实现

目录安装过程：完成之后，找个参考图片附ddddocr-验证码识别案例总结需要ocr识别，推荐一个Python免费的验证码识别-ddddocr 安装过程： 1、镜像安装：pip in...

99+

2024-04-02
微信小程序实现身份证识别-ocr

项目中有一个识别身份证的需求，经过调研，最后决定使用微信小程序ocr插件进行开发。一:首先登录小程序公众平台。进入设置> 第三方设置。添加ocr插件。添加完后，需要领取免费额度，100次/天。 https://fuw...

99+

2023-09-02

微信小程序小程序微信
Python通用验证码识别OCR库之ddddocr验证码识别

目录前言传统验证码滑动验证码文字点选验证码总结前言相信做自动化测试的同学一定不可忽视的问题就是验证码，他几乎是一个网站登录的标配，当然，我一般是不建议在这上面浪费时间去做识别的。 ...

99+

2024-04-02
python小白学习之路--01

为了坚持而坚持（这话说了自己不信）作为一个不懂编程的桌面，在技术的路上越走越远，严重到了找工作都很难的阶段，很心酸。。。作为一个干啥啥不行，吃啥啥有够，韩剧看不够，年纪又不小的我来说，在进步很难，不知路又走到哪就跑偏了，为了找到好工作而学习...

99+

2023-01-31

之路 python
Unity实现OCR文字识别功能

首先登陆百度开发者中心，搜索文字识别服务：创建一个应用，获取AppID、APIKey、SecretKey秘钥信息：下载C# SDK，将AipSdk.dll动态库导入Unit...

99+

2024-04-02
C#OCR实现文字识别功能

目录简介效果预览核心库概述问题源码界面布局后台逻辑简介 OCR英文全称是Optical Character Recognition，中文叫做光学字符识别。它是利用光学技术和计算机技术...

99+

2022-11-21

C# OCR文字识别 C# 文字识别 C# OCR
python ocr简单示例之识别验证码

最终运行效果： OCR（optical character recognition）文字识别是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，然后用字符识别方法将形状翻译成计...

99+

2023-01-16

python识别验证码 Python OCR 库
python实战教程之OCR文字识别方法汇总

目录方法一：使用easyocr模块方法二：通过pytesseract调用tesseractTesseract的安装与使用pytesseractcnocr 第二种 Python 开源...

99+

2023-05-18

python ocr文字识别 ocr文字识别算法 python ocr库
SpringBoot+OCR 实现图片文字识别

本篇介绍的是基于百度人工智能接口的文字识别实现。 1. 注册百度云，获得AppID 此处百度云非百度云盘，而是百度智能云。大家可进入https://cloud.baidu.com/...

99+

2024-04-02
基于Python实现图像文字识别OCR工具

目录引言功能列表OCR部分界面部分软件代码参考链接引言最近在技术交流群里聊到一个关于图像文字识别的需求，在工作、生活中常常会用到，比如票据、漫画、扫描件、照片的文本提取。博主基于...

99+

2024-04-02
小白学习Python之路---re模块学

本节大纲：　　1.正则表达式　　2.re模块的学习　　3.速记理解技巧　　4.挑战练习--开发一个简单的python计算器　　5.心得总结　　6.学习建议正则表达式：　　正则表达式，又称规则表达式。（英语：Regu...

99+

2023-01-31

之路模块 Python
如何使用Python实现图像文字识别OCR

要使用Python实现图像文字识别OCR，可以使用以下步骤：安装Tesseract OCR引擎 Tesseract是一种开源OCR引擎，可以处理多种语言和字体。要使用Python进行OCR，需要安装Tesseract OCR引擎。安装...

99+

2023-09-09

python opencv 计算机视觉 Powered by 金山文档
如何实现Opencv图片的OCR识别

小编给大家分享一下如何实现Opencv图片的OCR识别，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！一、图片变换0、导入模块导入相关函数，遇到报错的话，直接pip...

99+

2023-06-06
php怎么实现身份证OCR识别

本教程操作环境：windows7系统、PHP8.1版、DELL G3电脑基于PHP的身份证OCR识别接口调用示例接口备注：识别身份证正面或反面的一些关键字通过https://www.juhe.cn/docs/api/id/287自助申请开通...

99+

2024-04-02
php如何实现身份证OCR识别

这篇“php如何实现身份证OCR识别”文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希望大家阅读完这篇文章能有所收获，下面我们一起来看看这篇“php如何实现身份证OCR识别”文章吧。实...

99+

2023-07-04
如何用Python实现图像文字识别OCR工具

这篇文章主要介绍“如何用Python实现图像文字识别OCR工具”，在日常操作中，相信很多人在如何用Python实现图像文字识别OCR工具问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”如何用Python实现图像...

99+

2023-06-22
Unity怎么实现OCR文字识别功能

今天就跟大家聊聊有关Unity怎么实现OCR文字识别功能，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。首先登陆百度开发者中心，搜索文字识别服务：创建一个应用，获取AppID、APIK...

99+

2023-06-22
PyTorch实现手写数字的识别入门小白教程

目录手写数字识别（小白入门）1.数据预处理2.训练模型3.测试模型，保存4.调用模型5.完整代码手写数字识别（小白入门）今早刚刚上了节实验课，关于逻辑回归，所以手有点刺挠就想发个博...

99+

2024-04-02
Python小白学习之文件内建函数

2018-10-24 23:40:02 简单介绍： open()打开文件 read()读取文件（其实是输入文件里的内容到read函数，类似于get(url)，所以下面的图片备注的是输入，当然对于初学者来说，读取更容易理解。） ...

99+

2023-01-30

内建函数文件