iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >十行Python代码实现文字识别功能
  • 154
分享到

十行Python代码实现文字识别功能

2024-04-02 19:04:59 154人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

目录1.环境和配置要求百度接口2.具体实现步骤获取截图调用Baidu aip识别并打印文字调用打包程序生成专属识别文字小程序今天给大家分享的主题是用百度的接口实现图片的文字识别。 1

今天给大家分享的主题是用百度的接口实现图片的文字识别。

1.环境和配置要求

整体是用python实现,所需要使用的第三方库包括aip、PIL、keyboard、pyinstaller,如未安装,可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller指令安装。

百度接口

打开网址,如未注册请先注册,然后登录点击管理控制台,点击左侧产品服务人工智能文字识别,点击创建应用,输入应用名称如Baidu_OCR,选择用途如学习办公,最后进行简单应用描述,即可点击立即创建。会出现应用列表,包括AppID、API Key、Secret Key等信息,这些稍后会用到。

2.具体实现步骤

整个程序的大致思路是,在用截图软件获得截图之后,交给百度接口识别,并返回结果,当然,也可以是本地图片识别,我用的是QQ自带截图软件,快捷键CTRL+ALT+A用来打开截图,在选中所截区域后,按Enter键即可保存到粘贴板中,也可用其他截图软件。

获取截图

keyboard类库是用来监听键盘动作的,所以在有快捷键按下之后,便会有相应动作。并用PIL中的ImageGrab来获取到剪切板中的图片并生成本地图片文件。

#1.截图
keyboard.wait('ctrl+alt+a')
print('开始截图')
 
keyboard.wait('enter')
print('保存截图')
time.sleep(0.1)
 
#2.保存图片
image = ImageGrab.grabclipboard()
image.save('img.png')

调用Baidu aip识别并打印文字

先用注册时生成的应用的AppID、api Key、Secret Key初始化应用,再读取保存到的图片并打印识别的文字。

with open('img.png', 'rb') as fp:
    image = fp.read()
    text_list = client.basicAccurate(image)['Words_result']
    for text in text_list:
        print(text['words'])

运行结果如图所示:

我们还可增加一个无限循环使得一直能截图。

调用打包程序生成专属识别文字小程序

用pyinstaller库实现小程序的打包,生成.exe文件,这样就能随时识别文字了。在命令行中用pyinstaller xxx.py来打包生成exe文件,最后在生成的dist文件夹即可找到xxx.exe文件如下:

最后附上整个源代码:

#引入截图软件,获取文件到本地端,并识别图片文字,最后打包
import keyboard #控制键盘
from PIL import ImageGrab #保存图片
import time
from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = '17076767'
API_KEY = 'Af3Rj5HALMz5AN8prSgwTH4m'
SECRET_KEY = '******************'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
i = 0

while True:
    #1.截图
    keyboard.wait('ctrl+alt+a')
    print('开始截图')

    keyboard.wait('enter')
    print('保存截图')
    time.sleep(0.1)

    #2.保存图片
    image = ImageGrab.grabclipboard()
    image.save('img{}.png'.fORMat(i))


    """ 调用通用文字识别(高精度版) """

    with open('img{}.png'.format(i), 'rb') as fp:
        image = fp.read()
        text_list = client.basicAccurate(image)['words_result']
        for text in text_list:
            print(text['words'])

    i+=1

附图图片识别案例

到此这篇关于十行Python代码实现文字识别功能的文章就介绍到这了,更多相关Python文字识别内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: 十行Python代码实现文字识别功能

本文链接: https://www.lsjlt.com/news/117874.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 十行Python代码实现文字识别功能
    目录1.环境和配置要求百度接口2.具体实现步骤获取截图调用Baidu aip识别并打印文字调用打包程序生成专属识别文字小程序今天给大家分享的主题是用百度的接口实现图片的文字识别。 1...
    99+
    2024-04-02
  • 怎么用Python代码实现文字识别功能
    今天小编给大家分享一下怎么用Python代码实现文字识别功能的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。1.环境和配置要求...
    99+
    2023-06-30
  • Java 离线中文语音文字识别功能的实现代码
    目录1、pom文件如下:2、工程结构:3、语音识别工具类4、前端交互5、前端页面6、运行效果项目需要,要实现类似小爱同学的语音控制功能,并且要离线,不能花公司一分钱。第一步就是需要把...
    99+
    2024-04-02
  • Python三十行代码实现简单人脸识别的示例代码
    一、库介绍 opencv,face_recognition,numpy,以及dlib 注意: 安装opencv速度可能过慢,需要更换国内镜像源,参考:https://www.jb...
    99+
    2024-04-02
  • Unity实现OCR文字识别功能
    首先登陆百度开发者中心,搜索文字识别服务: 创建一个应用,获取AppID、APIKey、SecretKey秘钥信息: 下载C# SDK,将AipSdk.dll动态库导入Unit...
    99+
    2024-04-02
  • C#OCR实现文字识别功能
    目录简介效果预览核心库概述问题源码界面布局后台逻辑简介 OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术...
    99+
    2022-11-21
    C# OCR文字识别 C# 文字识别 C# OCR
  • 不到十行实现javaCV图片OCR文字识别
    spring boot项目pom文件中添加以下依赖  <!-- https://mvnrepository.com/artifact/org.bytedeco...
    99+
    2024-04-02
  • 怎么使用十行Python代码实现酷炫功能
    本篇内容主要讲解“怎么使用十行Python代码实现酷炫功能”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么使用十行Python代码实现酷炫功能”吧!一、生成二维码二维码又称二维条码,常见的二维...
    99+
    2023-07-06
  • Unity怎么实现OCR文字识别功能
    今天就跟大家聊聊有关Unity怎么实现OCR文字识别功能,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。首先登陆百度开发者中心,搜索文字识别服务:创建一个应用,获取AppID、APIK...
    99+
    2023-06-22
  • python+opencv实现文字颜色识别与标定功能
            最近接了一个比较简单的图像处理的单子,花了一点时间随便写了一下:  数据集客户没有是自...
    99+
    2024-04-02
  • Python实现识别图片为文字的示例代码
    目录1、环境准备2、业务实现3、效果展示本来想着做一个将图片识别为文字的小功能,本想到Google上面第一页全是各种收费平台的广告。 这些平台提供的基本都是让我们通过调用相关的三方接...
    99+
    2024-04-02
  • 教你十行代码实现python向手机推送通知功能
    目录服务准备代码最近在跑深度学习的东西时,由于经常忘掉还在训练导致懂不懂就完了切回去看结果,然后网上搜索了一下最终找到一个还不错的应用,不用下什么东西就可以使用,代码也就10行左右(...
    99+
    2024-04-02
  • uniapp实现人脸识别功能的具体实现代码
    目录前言问题解决办法详细实现思路具体代码总结前言 对于前端来说,需要后端提供一个人脸识别接口,前端传入图片,接口识别并返回结果,如此看来,其实前端只需实现图片传入即可,但是其实不然,...
    99+
    2022-12-08
    uniapp 人脸识别 uniapp小程序人脸识别 uniapp人脸识别功能
  • Python+Opencv实现数字识别的示例代码
    一、什么是数字识别?   所谓的数字识别,就是使用算法自动识别出图片中的数字。具体的效果如下图所示: 上图展示了算法的处理效果,算法能够自动的识别到LC...
    99+
    2024-04-02
  • php如何实现识别错别字功能
    本篇内容主要讲解“php如何实现识别错别字功能”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“php如何实现识别错别字功能”吧!首先,PHP内置了一些字符串操作函数,其中就包括字符替换函数。我们可...
    99+
    2023-07-05
  • Python几行代码即可实现人脸识别
    摘要:一行代码实现人脸识别 首先你需要提供一个文件夹,里面是所有你希望系统认识的人的图片。其中每个人一张图片,图片以人的名字命名。 接下来,你需要准备另一个文件夹,...
    99+
    2024-04-02
  • 如何用三行Python代码实现验证码识别
    这篇文章主要介绍了如何用三行Python代码实现验证码识别的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇如何用三行Python代码实现验证码识别文章都会有所收获,下面我们一起来看看吧。源码如下:调试:输出:关于...
    99+
    2023-06-04
  • Python调用百度AI实现图片上文字识别功能实例
    目录简介步骤安装百度AI库注册百度AI开放平台调用glob库调用AipOcr库识别文字可能会遇到的问题批量操作总结简介 Python免费调用百度AI实现图片上面的文字识别 步骤 安装...
    99+
    2024-04-02
  • 只一行Python代码能实现哪些功能
    本篇内容主要讲解“只一行Python代码能实现哪些功能”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“只一行Python代码能实现哪些功能”吧!一行代码打印乘法口诀print('\n...
    99+
    2023-06-02
  • java使用tess4j进行图片文字识别功能
    目录java使用tess4j进行图片文字识别一、简介二、使用过程1.maven依赖引入pom.xml2.准备好tessdata目录下的语言库文件3.写测试代码进行测试三、源码下载地址...
    99+
    2023-05-14
    java图片文字识别 java图片文字识别 java tess4j识别图片文字
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作