iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >使用Python怎么实现自动提取并收集信息
  • 912
分享到

使用Python怎么实现自动提取并收集信息

2023-06-15 03:06:01 912人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

本篇文章给大家分享的是有关使用python怎么实现自动提取并收集信息,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。代码实现导入需要的库,包括百度的api接口跟cv2图像截图图库

本篇文章给大家分享的是有关使用python怎么实现自动提取并收集信息,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

代码实现

导入需要的库,包括百度的api接口跟cv2图像截图图库

import cv2from aip import AipOcr# 读取图片,利用imshow显示图片pic = cv2.imread(r'Y:\cut\img1.png')pic = cv2.resize(pic,None,fx = 0.5, fy = 0.5)cv2.imshow('img',pic)cv2.waiTKEy(0)

截取图片,获取需要的信息,包括以下信息

  • 时间Time

  • 商家business

  • 商品Goods

  • 价格money

  • 单号num

# 删除不必要的部分img = pic[210:500, 100:580]# 截取各部分的文字time = pic[400:430, 100:580]business = pic[370:400, 100:580]goods = pic[350:380, 100:580]money = pic[210:300, 100:580]num = pic[460:500, 100:580]# 查看截取的部分是否合适gener_name = ['time','business','goods','money','num']excel_data = {}pd_columns = ["a","b","c","d","e"] # 标题

使用Python怎么实现自动提取并收集信息
使用Python怎么实现自动提取并收集信息
使用Python怎么实现自动提取并收集信息
使用Python怎么实现自动提取并收集信息

定义函数将截取好的图片另存到文件夹

def shotcut_image(args):    for index in gener:        cv2.imwrite('image/{}.png'.fORMat(args), img)

调用百度api接口,实现文字识别

# 导入apiAppID = '24177719'API_Key = 'p8skmRYfHGoVGR4UU03Q5jiM'Secret_Key = 'dyM0tzSILBZu9CFqZ7IkjWwECGaws4xo'cilent = AipOcr(AppID,API_Key,Secret_Key)def get_Words(img_name):    with open('image/{}.png'.format(img_name), 'rb') as f:        result = cilent.basicAccurate(f.read())        return result

最后将信息转为Dataframe,利用pandas的to_exccel功能,将数据放到excel里面

def convert_to_dataframe(words):    # 构建dataframe    result = words['words_result']    for word in result:        excel_data.setdefault('a', []).append(word['words'])# 将所有words读取后,取出语句存入exceldef convert_to_excel():    frame = DataFrame(excel_data, columns=pd_columns)    # todo 表头需要额外处理,这里指定不设置表头    frame.to_excel('out.xls',index=False, header=False)

使用Python怎么实现自动提取并收集信息

Python主要用来做什么

Python主要应用于:1、web开发;2、数据科学研究;3、网络爬虫;4、嵌入式应用开发;5、游戏开发;6、桌面应用开发。

以上就是使用Python怎么实现自动提取并收集信息,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注编程网Python频道。

--结束END--

本文标题: 使用Python怎么实现自动提取并收集信息

本文链接: https://www.lsjlt.com/news/277161.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 使用Python怎么实现自动提取并收集信息
    本篇文章给大家分享的是有关使用Python怎么实现自动提取并收集信息,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。代码实现导入需要的库,包括百度的api接口跟cv2图像截图图库...
    99+
    2023-06-15
  • 教你用Python实现自动提取并收集信息的功能
    目录一、简介二、代码实现一、简介 本功能目的在于提取收据/发票上的信息,用机器代替人的方式,提高工作效率 实现方式是通过cv2模块截取需要的信息,调用百度的api文...
    99+
    2022-11-12
  • Oracle自动收集统计信息怎么实现
    这篇文章主要介绍“Oracle自动收集统计信息怎么实现”,在日常操作中,相信很多人在Oracle自动收集统计信息怎么实现问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Orac...
    99+
    2022-10-19
  • 怎么使用Python PaddleNLP信息抽取提取快递单信息
    这篇文章主要讲解了“怎么使用Python PaddleNLP信息抽取提取快递单信息”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python PaddleNLP信...
    99+
    2023-07-02
  • python怎么实现微信自动发送信息
    要实现微信自动发送信息,可以使用Python的第三方库itchat来实现。itchat是一个开源的微信个人号接口,可以通过Pytho...
    99+
    2023-08-31
    python
  • 怎么在python中实现被动信息搜集
    这篇文章将为大家详细讲解有关怎么在python中实现被动信息搜集,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研...
    99+
    2023-06-14
  • 怎么用Python实现爬取百度热搜信息
    小编给大家分享一下怎么用Python实现爬取百度热搜信息,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!前言何为爬虫,其实就是利用计算机模拟人对网页的操作例如 模拟人类浏览购物网站使用爬虫前一定要看目标网站可刑不可刑 :-)...
    99+
    2023-06-26
  • Python基于Selenium怎么实现动态网页信息的爬取
    这篇文章主要介绍“Python基于Selenium怎么实现动态网页信息的爬取”,在日常操作中,相信很多人在Python基于Selenium怎么实现动态网页信息的爬取问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答...
    99+
    2023-06-22
  • python怎么实现微信收红包自动化测试脚本
    这篇文章主要介绍“python怎么实现微信收红包自动化测试脚本”,在日常操作中,相信很多人在python怎么实现微信收红包自动化测试脚本问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python怎么实现微信收...
    99+
    2023-06-20
  • 在Android 中使用ContentObserver怎么获取短信验证码并实现自动填充
    在Android 中使用ContentObserver怎么获取短信验证码并实现自动填充?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。步骤:首先我使用了Conte...
    99+
    2023-05-31
    android contentobserver bs
  • python利用Appium实现自动控制移动设备并提取数据功能
    目录1. 安装appium-python-client模块并启动已安装好的环境 1.1 安装appium-python-client模块1.2 启动夜神模拟器1.3 启动a...
    99+
    2022-11-12
  • 如何使用Python爬虫实现抓取电影网站信息并入库
    这篇文章主要介绍如何使用Python爬虫实现抓取电影网站信息并入库,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一.环境搭建1.下载安装包访问 Python官网下载地址:https://www.python.org/...
    99+
    2023-06-29
  • Python自动化办公之手机号提取怎么实现
    这篇文章主要介绍“Python自动化办公之手机号提取怎么实现”,在日常操作中,相信很多人在Python自动化办公之手机号提取怎么实现问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python自动化办公之手机号...
    99+
    2023-07-02
  • 怎么用vbs实现微信自动发送消息功能
    这篇文章主要介绍了怎么用vbs实现微信自动发送消息功能的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇怎么用vbs实现微信自动发送消息功能文章都会有所收获,下面我们一起来看看吧。1、微信自动回复消息微信,作为日前...
    99+
    2023-06-30
  • Python怎么利用psutil实现获取硬件,网络和进程信息
    楔子Python 有一个第三方模块叫 psutil,专门用来获取操作系统以及硬件相关的信息,比如:CPU、磁盘、网络、内存等等。下面来看一下它的用法,不过在使用之前需要先安装,直接 pip install psutil 即可。CPU 相关获...
    99+
    2023-05-14
    Python psutil
  • 怎么使用python实现学生信息管理系统
    本文将为大家详细介绍“怎么使用python实现学生信息管理系统”,内容步骤清晰详细,细节处理妥当,而小编每天都会更新不同的知识点,希望这篇“怎么使用python实现学生信息管理系统”能够给你意想不到的收获,请大家跟着小编的思路慢慢深入,具体...
    99+
    2023-06-06
  • 怎么使用Python实现员工信息管理系统
    本文小编为大家详细介绍“怎么使用Python实现员工信息管理系统”,内容详细,步骤清晰,细节处理妥当,希望这篇“怎么使用Python实现员工信息管理系统”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。1.职员信息管...
    99+
    2023-06-30
  • 使用python怎么实现企业微信发送消息
    这篇文章给大家介绍使用python怎么实现企业微信发送消息,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。一、需要的参数1、通讯用户:touser 或 通讯组:toparty  &...
    99+
    2023-06-15
  • Python怎么用正则表达式实现爬取古诗文网站信息
    本篇内容介绍了“Python怎么用正则表达式实现爬取古诗文网站信息”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!分析古诗文网站下图1展示了古...
    99+
    2023-06-25
  • 使用Python怎么操作Excel实现自动分组合并单元格
    这篇文章主要介绍了使用Python怎么操作Excel实现自动分组合并单元格,编程网小编觉得不错,现在分享给大家,也给大家做个参考,一起跟随编程网小编来看看吧!df.to_excel('test.xlsx',index=Fal...
    99+
    2023-06-06
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作