iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >如何进行Python pandas两个表格内容模糊匹配的实现
  • 654
分享到

如何进行Python pandas两个表格内容模糊匹配的实现

2023-06-25 14:06:56 654人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

如何进行python pandas两个表格内容模糊匹配的实现,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。一、方法2此方法是两个表构建某一相同字段,然后全连接,

如何进行python pandas两个表格内容模糊匹配的实现,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

    一、方法2

    此方法是两个表构建某一相同字段,然后全连接,在做匹配结果筛选,此方法针对数据量不大的时候,逻辑比较简单,但是内存消耗较大

    1. 导入库

    import pandas as pdimport numpy as npimport re

    2. 构建关键词

    #关键词数据df_keyWord = pd.DataFrame({    "keyid" : np.arange(5),    "keyword" : ["numpy", "pandas", "matplotlib", "sklearn", "Tensorflow"]})df_keyword

    如何进行Python pandas两个表格内容模糊匹配的实现

    3. 构建句子

    df_sentence = pd.DataFrame({    "senid" : np.arange(10,17),    "sentence" : [        "怎样用pandas实现merge?",        "Python之Numpy详细教程",        "怎么使用Pandas批量拆分与合并excel文件?",        "怎样使用pandas的map和apply函数?",        "深度学习之tensorflow简介",        "tensorflow和numpy的关系",        "基于sklearn的一些机器学习的代码"    ]})df_sentence

    如何进行Python pandas两个表格内容模糊匹配的实现 

    4. 建立统一索引

    df_keyword['match'] = 1df_sentence['match'] = 1

    5. 表连接

    df_merge = pd.merge(df_keyword, df_sentence)df_merge

    如何进行Python pandas两个表格内容模糊匹配的实现

    6. 关键词匹配

    def match_func(row):    return re.search(row["keyword"], row["sentence"], re.IGNORECASE) is not Nonedf_merge[df_merge.apply(match_func, axis = 1)]

    匹配结果如下 

    如何进行Python pandas两个表格内容模糊匹配的实现

    二、方法2

    此方法对编程能力有要求,在大数据集上计算量较方法一小很多

    1. 构建字典

    key_word_dict = {    row.keyword : row.keyid    for row in df_keyword.itertuples()}key_word_dict
    {'numpy': 0, 'pandas': 1, 'matplotlib': 2, 'sklearn': 3, 'tensorflow': 4}

    2. 关键词匹配

    def merge_func(row):    #新增一列,表示可以匹配的keyid    row["keyids"] = [        keyid        for key_word, keyid in key_word_dict.items()        if re.search(key_word, row["sentence"], re.IGNORECASE)    ]    return rowdf_merge = df_sentence.apply(merge_func, axis = 1)

    3. 结果展示

    df_merge

    如何进行Python pandas两个表格内容模糊匹配的实现

    4. 匹配结果展开

    df_result = pd.merge(left = df_merge.explode("keyids"),right = df_keyword,left_on = "keyids",right_on = "keyid")df_result

    如何进行Python pandas两个表格内容模糊匹配的实现

    看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注编程网Python频道,感谢您对编程网的支持。

    --结束END--

    本文标题: 如何进行Python pandas两个表格内容模糊匹配的实现

    本文链接: https://www.lsjlt.com/news/305416.html(转载时请注明来源链接)

    有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

    本篇文章演示代码以及资料文档资料下载

    下载Word文档到电脑,方便收藏和打印~

    下载Word文档
    猜你喜欢
    • 如何进行Python pandas两个表格内容模糊匹配的实现
      如何进行Python pandas两个表格内容模糊匹配的实现,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。一、方法2此方法是两个表构建某一相同字段,然后全连接,...
      99+
      2023-06-25
    • Python Pandas两个表格内容模糊匹配的实现
      目录一、方法21. 导入库2. 构建关键词3. 构建句子4. 建立统一索引5. 表连接6. 关键词匹配二、方法21. 构建字典2. 关键词匹配3. 结果展示4. 匹配结果展开总结一、...
      99+
      2024-04-02
    • 通过python模糊匹配算法对两个excel表格内容归类
      目录一、问题描述二、运用方法三、代码编写3.13.23.33.43.5四、代码集合五、总结一、问题描述 在实习的时候,需要将两个表格的内容进行匹配分类,比如两个不同的工程项目针对的对...
      99+
      2023-03-22
      python excel表格归类 python模糊匹配算法归类
    • 怎么通过python模糊匹配算法对两个excel表格内容归类
      今天小编给大家分享一下怎么通过python模糊匹配算法对两个excel表格内容归类的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下...
      99+
      2023-07-05
    • Python3如何实现列表模糊匹配列表
      目录Python3列表模糊匹配列表B列表模糊匹配A列表Python 模糊匹配搜索问题fuzzywuzzydifflibPython3列表模糊匹配列表 B列表模糊匹配A列表 a = [...
      99+
      2024-04-02
    • 如何在Python中使用正则表达式进行模式匹配
      正则表达式是一种强大的文本匹配工具,可以在Python中使用re模块来进行模式匹配。以下是使用正则表达式进行模式匹配的一般步骤:1. 导入re模块:首先,需要导入re模块,使用import re语句。2. 创建正则表达式:使用re模块的co...
      99+
      2024-02-22
      Python 正则表达式 匹配
    • 如何进行正则表达式匹配字符串的实现
      如何进行正则表达式匹配字符串的实现,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。使用正则表达式最常用的是考虑实现正则表达式匹配的判断,在实际工作中经常会遇到什么...
      99+
      2023-06-17
    • wps中如何将两个表格的内容合并到一起
      小编给大家分享一下wps中如何将两个表格的内容合并到一起,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!把两个表格的内容合并到一起的方法是,首先打开一张空表,点击智能工具箱栏目;然后找到合并表格选项,点击下拉按钮,选择【多个...
      99+
      2023-06-14
    • 如何进行图片JNI C++\Java高斯模糊的实现
      这篇文章将为大家详细讲解有关如何进行图片JNI C++\Java高斯模糊的实现,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。开工吧说明:其中代码大部分来源于网络,不过都是开源的。最原始的代码...
      99+
      2023-06-19
    • 如何进行实现Python的配置
      今天就跟大家聊聊有关如何进行实现Python的配置,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。在Python配置中的一个文本区域,其中某个名字空间可以直接访问,“直接访问” 这里指...
      99+
      2023-06-17
    • 如何使用Python中的正则表达式进行字符串匹配
      如何使用Python中的正则表达式进行字符串匹配正则表达式是一种强大的字符串模式匹配工具,它能够在文本中查找特定的模式,使程序能够更快速、更灵活地处理字符串。在Python中,我们可以使用re模块来操作正则表达式。本文将介绍如何使用Pyth...
      99+
      2023-10-22
      Python 正则表达式 字符串匹配
    • HTML怎么实现对象内首行缩进两个汉字的空格效果
      这篇文章主要介绍“HTML怎么实现对象内首行缩进两个汉字的空格效果”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“HTML怎么实现对象内首行缩进两个汉字的空格效果”文...
      99+
      2024-04-02
    • python如何实现两个列表的笛卡尔积
      这篇文章主要介绍了python如何实现两个列表的笛卡尔积,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。两个列表的笛卡尔积>>&g...
      99+
      2024-04-02
    • jquery如何实现在加载完iframe的内容后再进行操作
      为iframe添加onload事件 ie使用attachEvent("onload",function(){}) firefox、chrome使用addEventListener("...
      99+
      2022-11-15
      jquery 加载完iframe
    • ajax返回的json内容如何进行排序使用sort()方法实现
      ajax返回的json内容如何进行排序使用sort()方法实现,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。 关键...
      99+
      2024-04-02
    • 如何使用fdopen实现对Python进程产生的文件进行权限最小化配置
      今天小编给大家分享一下如何使用fdopen实现对Python进程产生的文件进行权限最小化配置的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起...
      99+
      2023-07-05
    软考高级职称资格查询
    编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
    • 官方手机版

    • 微信公众号

    • 商务合作