iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >怎么在python中使用pandas进行模糊匹配
  • 704
分享到

怎么在python中使用pandas进行模糊匹配

2023-06-07 14:06:50 704人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

这期内容当中小编将会给大家带来有关怎么在python中使用pandas进行模糊匹配,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。Python可以做什么Python是一种编程语言,内置了许多有效的工具,Py

这期内容当中小编将会给大家带来有关怎么在python中使用pandas进行模糊匹配,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

Python可以做什么

Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗易懂、容易入门、功能强大,在许多领域中都有广泛的应用,例如最热门的大数据分析人工智能web开发等。

1.首先读取excel文件

怎么在python中使用pandas进行模糊匹配

数据代表了各个城市店铺的装修和配置费用,要统计出装修和配置项的总费用并进行加和计算;

2.pandas实现过程

import pandas as pd#1.读取数据df = pd.read_excel(r'./data/pfee.xlsx')print(df)

怎么在python中使用pandas进行模糊匹配

cols = list(df.columns)print(cols)

怎么在python中使用pandas进行模糊匹配

#2.获取含有装修 和 配置 字段的数据zx_lists=[]pz_lists=[]for name in cols: if '装修' in name:  zx_lists.append(name) elif '配置' in name:  pz_lists.append(name)print(zx_lists)print(pz_lists)

怎么在python中使用pandas进行模糊匹配

#3.对装修和配置项费用进行求和计算df['装修-求和'] =df[zx_lists].apply(lambda x:x.sum(),axis=1)df['配置-求和'] = df[pz_lists].apply(lambda x:x.sum(),axis=1)print(df)

怎么在python中使用pandas进行模糊匹配

补充:pandas 中dataframe 中的模糊匹配 与pyspark dataframe 中的模糊匹配

1.pandas dataframe

匹配一个很简单,批量匹配如下

df_obj[df_obj['title'].str.contains(r'.*?n.*')] #使用正则表达式进行模糊匹配,*匹配0或无限次,?匹配0或1次

pyspark dataframe 中模糊匹配有两种方式

2.spark dataframe api, filter rlike 联合使用

df1=df.filter("uri rlike  'com.tencent.tmgp.sgame|%E8%80%85%E8%8D%A3%E8%80%80_|Android.uGC.live|\ %e7%88f%e8%a7%86%e9%a2%91|%E7%%8F%E8%A7%86%E9%A2%91'").groupBy("uri").\ count().sort("count", ascending=False)

注意点:

rlike 后面进行批量匹配用引号包裹即可

rlike 中要匹配特殊字符的话,不需要转义

rlike '\\\\bapple\\\\b' 虽然也可以匹配但是匹配数量不全,具体原因不明,欢迎讨论。

In [5]: df.filter("name rlike '%'").show()+---+------+-----+|age|height| name|+---+------+-----+| 4| 140|A%l%i|| 6| 180| i%ce|+---+------+-----+

3.spark sql

spark.sql("select uri from t where uri like '%com.tencent.tmgp.sgame%' or uri like 'douyu'").show(5)

如果要批量匹配的话,就需要在后面继续添加uri like '%blabla%',就有点繁琐了。

对了这里需要提到原生sql 的批量匹配,regexp 就很方便了,跟rlike 有点相似

mysql> select count(*) from url_parse where uri regexp 'android.ugc.live|com.tencent.tmgp.sgame';+----------+| count(*) |+----------+|  9768 |+----------+1 row in set (0.52 sec)

于是这里就可以将sql中regexp 应用到spark sql 中

In [9]: spark.sql('select * from t where name regexp "%l|t|_"').show()+---+------+------+|age|height| name|+---+------+------+| 1| 150|Al_ice|| 4| 140| A%l%i|+---+------+------+

上述就是小编为大家分享的怎么在python中使用pandas进行模糊匹配了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注编程网Python频道。

--结束END--

本文标题: 怎么在python中使用pandas进行模糊匹配

本文链接: https://www.lsjlt.com/news/249578.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 怎么在python中使用pandas进行模糊匹配
    这期内容当中小编将会给大家带来有关怎么在python中使用pandas进行模糊匹配,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。python可以做什么Python是一种编程语言,内置了许多有效的工具,Py...
    99+
    2023-06-07
  • 如何进行Python pandas两个表格内容模糊匹配的实现
    如何进行Python pandas两个表格内容模糊匹配的实现,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。一、方法2此方法是两个表构建某一相同字段,然后全连接,...
    99+
    2023-06-25
  • linux grep模糊匹配方法怎么使用
    在Linux中,可以使用`grep`命令进行模糊匹配。`grep`命令用于在文本文件中查找指定模式的行。要使用`grep`命令进行模...
    99+
    2023-09-25
    linux
  • 怎么在Python中使用Pandas进行数据清洗
    怎么在Python中使用Pandas进行数据清洗?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。python的五大特点是什么python的五大特点:1.简单易学,...
    99+
    2023-06-14
  • 怎么在Python中使用OpenCV匹配人眼
    这篇文章给大家介绍怎么在Python中使用OpenCV匹配人眼,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。什么是模板匹配模板匹配是指在当前图像A内寻找与图像B最相似的部分,可以理解找茬,但是这里是找出一样的信息。一般...
    99+
    2023-06-15
  • 怎么在python中使用pandas模块查看DataFrame
    这篇文章将为大家详细讲解有关怎么在python中使用pandas模块查看DataFrame,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。1、首先加载pandas模块import p...
    99+
    2023-06-15
  • 怎么在python中使用Pandas对MySQL数据库进行读写
    本篇文章给大家分享的是有关怎么在python中使用Pandas对MySQL数据库进行读写,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。1、read_sql_query 读取 m...
    99+
    2023-06-14
  • Python怎么使用Pandas进行数据分析
    首先,确保您已经安装了Pandas库。如果没有,请使用以下命令安装:pip install pandas一. 导入Pandas库import pandas as pd二. 读取数据使用Pandas,可以方便地读取多种数据格式,包括CSV、E...
    99+
    2023-05-16
    Python Pandas
  • 怎么在Python中使用findall函数匹配字符串
    怎么在Python中使用findall函数匹配字符串?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Python主要用来做什么Python主要应用于:1、Web开...
    99+
    2023-06-15
  • 怎么在python中使用正则match( )方法匹配目标
    这期内容当中小编将会给大家带来有关怎么在python中使用正则match( )方法匹配目标,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1、正则表达式作用给定的字符串是否符合正则表达式的过滤逻辑(“匹配”...
    99+
    2023-06-14
  • 怎么在python中使用pandas合并Sheet
    本篇文章给大家分享的是有关怎么在python中使用pandas合并Sheet,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。使用python中的pandas,xlrd,openp...
    99+
    2023-06-14
  • 怎么在linux中使用grep 匹配制表符
    本篇文章给大家分享的是有关怎么在linux中使用grep 匹配制表符,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。使用:[root@dhcp-9-79 ~]#&nbs...
    99+
    2023-06-09
  • 怎么在Python中使用pandas合并数据
    这期内容当中小编将会给大家带来有关怎么在Python中使用pandas合并数据,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研...
    99+
    2023-06-14
  • Android应用中怎么对搜索关键字进行匹配
    这期内容当中小编将会给大家带来有关Android应用中怎么对搜索关键字进行匹配,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1. 单关键字 匹配如果只是单关键字的话,那么我们先计算出他的下标,它的长度,然...
    99+
    2023-05-31
    android roi
  • 如何使用Python中的正则表达式进行字符串匹配
    如何使用Python中的正则表达式进行字符串匹配正则表达式是一种强大的字符串模式匹配工具,它能够在文本中查找特定的模式,使程序能够更快速、更灵活地处理字符串。在Python中,我们可以使用re模块来操作正则表达式。本文将介绍如何使用Pyth...
    99+
    2023-10-22
    Python 正则表达式 字符串匹配
  • 怎么在Python中使用sql语句多条件模糊查询mysql数据库
    怎么在Python中使用sql语句多条件模糊查询mysql数据库?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。def find_worldByName(c_nam...
    99+
    2023-06-14
  • Python中怎么使用正则表达式匹配方法
    本篇文章为大家展示了Python中怎么使用正则表达式匹配方法,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。测试正则表达式是否匹配字符串的全部或部分regex=ur"" ...
    99+
    2023-06-17
  • 怎么在Python中使用pandas实现数据分析
    怎么在Python中使用pandas实现数据分析?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。一、比较运算符和比较方法比较运算符用于判断是否相等和比较大小,Py...
    99+
    2023-06-15
  • 怎么在python中使用StringIO进行读写
    怎么在python中使用StringIO进行读写?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。python可以做什么Python是一种编程语言,内置了许多有效的...
    99+
    2023-06-14
  • Python中的Pandas时间函数time、datetime模块怎么使用
    本文小编为大家详细介绍“Python中的Pandas时间函数time、datetime模块怎么使用”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python中的Pandas时间函数time、datetime模块怎么使用”文章能帮助大家解决...
    99+
    2023-07-05
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作