iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python怎么实现识别文字中的省市区并绘图
  • 819
分享到

Python怎么实现识别文字中的省市区并绘图

2023-07-02 13:07:20 819人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍“python怎么实现识别文字中的省市区并绘图”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python怎么实现识别文字中的省市区并绘图”文章能帮助大家解决问题。1.准备开始之前,你

这篇文章主要介绍“python怎么实现识别文字中的省市区并绘图”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python怎么实现识别文字中的省市区并绘图”文章能帮助大家解决问题。

1.准备

开始之前,你要确保Python和pip已经成功安装在电脑上。

(可选1) 如果你用Python的目的是数据分析,可以直接安装Anaconda,它内置了Python和pip.

(可选2) 此外,推荐大家用vscode编辑器,它有许多的优点

请选择以下任一种方式输入命令安装依赖

windows 环境 打开 Cmd (开始-运行-CMD)。

MacOS 环境 打开 Terminal (command+空格输入Terminal)。

如果你用的是 VSCode编辑器 或 PyCharm,可以直接使用界面下方的Terminal.

pip install cpca

注意,目前 cpca 模块仅支持python3及以上版本。

在 windows 上可能会出现类似如下问题:

Building wheel for pyahocorasick (setup.py) ... error

先阅读原文去下载 Microsoft Visual c++ Build Tools 安装VC++构建工具,再重新 pip install cpca,即可解决问题。

2.基本使用

通过两行代码就能实现最基本的省市区提取:

# 公众号: Python 实用宝典# 2022/06/23import cpcalocation_str = [    "广东省深圳市福田区巴丁街深南中路1025号新城大厦1层",    "特斯拉上海超级工厂是特斯拉汽车首座美国本土以外的超级工厂,位于中华人民共和国上海市。",    "三星堆遗址位于中国四川省广汉市城西三星堆镇的鸭子河畔,属青铜时代文化遗址"]df = cpca.transfORM(location_str)print(df)

效果如下:

省 市 区 地址 adcode
0 广东省 深圳市 福田区 巴丁街深南中路1025号新城大厦1层 440304
1 上海市 None None 。310000
2 四川省 德阳市 广汉市 城西三星堆镇的鸭子河畔,属青铜时代文化遗址 510681

注意第三条的广汉市,cpca 不仅识别到了语句中的县级市广汉市,还能自动匹配到其代管市的德阳市,不得不说非常强大。

如果你想获知程序是从字符串的那个位置提取出省市区名的,可以添加一个 pos_sensitive=True 参数:

# 公众号: Python 实用宝典# 2022/06/23import cpcalocation_str = [    "广东省深圳市福田区巴丁街深南中路1025号新城大厦1层",    "特斯拉上海超级工厂是特斯拉汽车首座美国本土以外的超级工厂,位于中华人民共和国上海市。",    "三星堆遗址位于中国四川省广汉市城西三星堆镇的鸭子河畔,属青铜时代文化遗址"]df = cpca.transform(location_str, pos_sensitive=True)print(df)

效果如下:

(base) G:\push\20220623>python 1.py
     省 市 区 地址 adcode 省_pos 市_pos 区_pos
0  广东省 深圳市 福田区 巴丁街深南中路1025号新城大厦1层 440304      0      3      6
1  上海市 None None 。310000     38     -1     -1
2  四川省 德阳市 广汉市 城西三星堆镇的鸭子河畔,属青铜时代文化遗址 510681      9     -1     12

它标记出了识别到省、市、区的关键位置(index),当然如果是德阳市这种特殊的识别会被标记为-1.

3.高级使用

它还可以从大段文本中批量识别多个地区:

# 公众号: Python 实用宝典# 2022/06/23import cpcalong_text = "对一个城市的评价总会包含个人的感情。如果你喜欢一个城市,很有可能是喜欢彼时彼地的自己。"\    "在广州、香港读过书,工作过,在深圳买过房、短暂生活过,去北京出了几次差。"\    "想重点比较一下广州、深圳和香港,顺带说一下北京。总的来说,觉得广州舒适、"\    "香港精致、深圳年轻气氛好、北京大气又粗糙。答主目前选择了广州。"df = cpca.transform_text_with_addrs(long_text, pos_sensitive=True)print(df)

效果如下:

(base) G:\push\20220623>python 1.py
          省 市 区 地址 adcode 省_pos 市_pos 区_pos
0       广东省 广州市 None     440100     -1     44     -1
1   香港特别行政区 None  None     810000     47     -1     -1
2       广东省 深圳市 None     440300     -1     58     -1
3       北京市 None  None     110000     71     -1     -1
4       广东省 广州市 None     440100     -1     86     -1
5       广东省 深圳市 None     440300     -1     89     -1
6   香港特别行政区 None  None     810000     92     -1     -1
7       北京市 None  None     110000    100     -1     -1
8       广东省 广州市 None     440100     -1    110     -1
9   香港特别行政区 None  None     810000    115     -1     -1
10      广东省 深圳市 None     440300     -1    120     -1
11      北京市 None  None     110000    128     -1     -1
12      广东省 广州市 None     440100     -1    143     -1

不仅如此,模块中还自带一些简单绘图工具,可以在地图上将上面输出的数据以热力图的形式画出来:

# 公众号: Python 实用宝典# 2022/06/23import cpcafrom cpca import drawerlong_text = "对一个城市的评价总会包含个人的感情。如果你喜欢一个城市,很有可能是喜欢彼时彼地的自己。"\    "在广州、香港读过书,工作过,在深圳买过房、短暂生活过,去北京出了几次差。"\    "想重点比较一下广州、深圳和香港,顺带说一下北京。总的来说,觉得广州舒适、"\    "香港精致、深圳年轻气氛好、北京大气又粗糙。答主目前选择了广州。"df = cpca.transform_text_with_addrs(long_text, pos_sensitive=True)drawer.draw_locations(df[cpca._ADCODE], "df.html")

运行的时候可能会报这个错:

(base) G:\push\20220623>python 1.py
Traceback (most recent call last):
  File "1.py", line 12, in <module>
    drawer.draw_locations(df[cpca._ADCODE], "df.html")
  File "G:\Anaconda3\lib\site-packages\cpca\drawer.py", line 41, in draw_locations
    import folium
ModuleNotFoundError: No module named 'folium'

使用pip安装即可:

pip install folium

然后重新运行代码,会在当前目录下生成 df.html, 双击打开,效果如下:

Python怎么实现识别文字中的省市区并绘图

关于“Python怎么实现识别文字中的省市区并绘图”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网Python频道,小编每天都会为大家更新不同的知识点。

--结束END--

本文标题: Python怎么实现识别文字中的省市区并绘图

本文链接: https://www.lsjlt.com/news/341876.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python实现识别文字中的省市区并绘图
    目录1.准备2.基本使用3.高级使用在做NLP(自然语言处理)相关任务时,经常会遇到需要识别并提取省、城市、行政区的需求。虽然我们自己通过关键词表一个个查找也能实现提取目的,但是需要...
    99+
    2024-04-02
  • Python怎么实现识别文字中的省市区并绘图
    这篇文章主要介绍“Python怎么实现识别文字中的省市区并绘图”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python怎么实现识别文字中的省市区并绘图”文章能帮助大家解决问题。1.准备开始之前,你...
    99+
    2023-07-02
  • Python怎么实现截图识别文字
    这篇文章主要讲解了“Python怎么实现截图识别文字”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python怎么实现截图识别文字”吧!前言系统:win10Python版本:python3....
    99+
    2023-06-21
  • Python中怎么实现文字识别
    这期内容当中小编将会给大家带来有关Python中怎么实现文字识别,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。环境和配置要求整体是用Python实现,所需要使用的第三方库包括aip、PIL、keyboar...
    99+
    2023-06-16
  • Python实现批量识别图片文字并存为Excel
    目录一、背景二、需求三、实战1.安装模块2.识别一张图片3.批量识别图片4.保存数据一、背景 大家好,我是J哥。 也许你还记得,前不久复旦大学一博士生写了130行Python代码,批...
    99+
    2024-04-02
  • Python 图片文字识别的实现之PaddleOCR
    目录项目使用项目结构环境部署1、安装Anaconda,构造虚拟环境2、依赖包下载测试代码参数补充总结前言 什么是OCR? 光学字符识别(Optical Character R...
    99+
    2024-04-02
  • Python如何实现图片文字识别
    这篇文章主要为大家展示了“Python如何实现图片文字识别”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Python如何实现图片文字识别”这篇文章吧。前言什么是OCR光学字符识别(Optical...
    99+
    2023-06-25
  • Python 识别录音并转为文字的实现
    目录程式功能: 用 UI 界面,点击界面上的“开始识别”来录音(调用百度云语音接口),并自动将结果显示在界面的文本框中 Time: 2022/03/06 Au...
    99+
    2024-04-02
  • Python实战之实现截图识别文字
    目录前言一、获取百度智能云token二、百度借口调用三、搭建窗口化的程序以便于使用四、实现截图的自动保存五、将识别到的文字输出显示在窗口文本框中并将文字发送到剪切板六、提取识别后文字...
    99+
    2024-04-02
  • Python通过pytesseract库实现识别图片中的文字
    目录前言一、pytesseract1.pytesseract是什么2.安装pytesseract3.查看pytesseract版本4.安装PIL5.查看PIL版本二、Tesserac...
    99+
    2023-05-19
    Python pytesseract识别图片中文字 Python pytesseract识别文字 Python pytesseract
  • element-ui中Table表格省市区合并单元格怎么实现
    这篇文章主要为大家展示了“element-ui中Table表格省市区合并单元格怎么实现”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“element-ui中Tab...
    99+
    2024-04-02
  • Python如何实现批量识别图片文字并存为Excel
    今天小编给大家分享一下Python如何实现批量识别图片文字并存为Excel的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。一、...
    99+
    2023-07-02
  • 【Python • 图片识别】pytesseract快速识别提取图片中的文字
    提示:本文多图,请手机端注意流量。 文章目录 前言一、配置环境1. 安装python依赖2. 安装识别引擎安装tesseract识别引擎`(可跳过)`验证是否安装成功 二、使...
    99+
    2023-09-10
    python 开发语言
  • Android中怎么实现一个图片文字识别功能
    Android中怎么实现一个图片文字识别功能,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。添加依赖implementation 'com.rmtheis:...
    99+
    2023-06-20
  • C#.NET实现扫描识别图片中的文字
    目录环境配置操作步骤调用API接口扫描并读取图片中的文字C#VB.NET注意事项环境配置 本文以C#及VB.NET代码为例,介绍如何扫描并读取图片中的文字。 本次程序环境如下: ...
    99+
    2024-04-02
  • Python实现识别图片为文字的示例代码
    目录1、环境准备2、业务实现3、效果展示本来想着做一个将图片识别为文字的小功能,本想到Google上面第一页全是各种收费平台的广告。 这些平台提供的基本都是让我们通过调用相关的三方接...
    99+
    2024-04-02
  • 如何使用Python实现图像文字识别OCR
    要使用Python实现图像文字识别OCR,可以使用以下步骤: 安装Tesseract OCR引擎 Tesseract是一种开源OCR引擎,可以处理多种语言和字体。要使用Python进行OCR,需要安装Tesseract OCR引擎。安装...
    99+
    2023-09-09
    python opencv 计算机视觉 Powered by 金山文档
  • Python实现PDF文字识别提取并写入CSV文件
    目录1.前言2.需求描述3.开始动手动脑3.1安装相关第三方包3.2导入需要用到的第三方库3.3读取pdf文件,并识别内容3.4对识别的数据进行处理,写入csv文件总结1. 前言 扫...
    99+
    2024-04-02
  • 基于Python实现图像文字识别OCR工具
    目录引言功能列表OCR部分界面部分软件代码参考链接引言 最近在技术交流群里聊到一个关于图像文字识别的需求,在工作、生活中常常会用到,比如票据、漫画、扫描件、照片的文本提取。 博主基于...
    99+
    2024-04-02
  • Python基于百度API识别并提取图片中文字
    利用百度 AI 开发平台的 OCR 文字识别 API 识别并提取图片中的文字。首先需注册获取 API 调用的 ID 和 key,步骤如下: 打开百度AI开放平台,进入控制台中的文字识...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作