利用Pandas求两个dataframe差集的过程详解

2024-04-02 19:04:59 644人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

目录1、交集2、差集（df1-df2为例）总结1、交集 intersected=pd.merge(df1,df2,how='inner') 延伸（针对列求交集）int

1、交集

intersected=pd.merge(df1,df2,how='inner')

延伸（针对列求交集）intersected=pd.merge(df1,df2,on['name'],how='inner')

2、差集（df1-df2为例）

diff=pd.concat([df1,df2,df2]).drop_duplicates(keep=False)

差集函数的详解：

1、pandas 通过 concat() 函数能够轻松地将 Series 与 DataFrame 对象组合在一起，函数的语法格式如下： pd.concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False)

2、需要对dataframe中的一列值有重复的，应用drop_duplicates解决了此问题。

比如：

ata={"a":[1,1,2,4,3,9],"b":[2,2,3,5,5,10],"c":[3,4,5,6,6,11],"d":[4,5,6,7,8,12]}
pd_data=pd.DataFrame(data=data)
print(pd_data)
t=pd_data.drop_duplicates(subset=['c','b'],keep='last',inplace=False)
print(t)

说明：

keep='first'表示保留第一次出现的重复行，是默认值。keep另外两个取值为"last"和False，分别表示保留最后一次出现的重复行和去除所有重复行。

inplace=True表示直接在原来的DataFrame上删除重复项，而默认值False表示生成一个副本。如果要生成新的DataFrame:,inplace=False

subset要去重的列。subset=['c','b']，表示行中的记录：c和b列都重复的。

3、将concat和drop_duplicates结合起来就解决了求差集的问题。

另外，还有一种方法也可以达到同样的目的：

总结

到此这篇关于利用Pandas求两个dataframe差集的文章就介绍到这了,更多相关Pandas求dataframe差集内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 利用Pandas求两个dataframe差集的过程详解

本文链接: https://www.lsjlt.com/news/120191.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

利用Pandas求两个dataframe差集的过程详解

目录1、交集2、差集（df1-df2为例）总结1、交集 intersected=pd.merge(df1,df2,how='inner') 延伸（针对列求交集）int...

99+

2024-04-02
详解利用Pandas求解两个DataFrame的差集,交集,并集

目录模拟数据差集方法1：concat + drop_duplicates方法2：append + drop_duplicates交集方法1：merge方法2：concat + dup...

99+

2024-04-02
利用Java如何实现计算两个程序运行的时间差

这期内容当中小编将会给大家带来有关利用Java如何实现计算两个程序运行的时间差，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。一、获取系统当前时间long startTime = System.curren...

99+

2023-05-31

java ava 时间差
利用vue对比两组数据差异的可视化组件详解

目录需求：大概要点：根据刚才的要点可以建立一下组件的props：组件的基本样式也很简单：完事了，最后贴一下完整代码：使用示例：效果预览：扩展功能TODO：总结如题，朋友有个这样的需求...

99+

2024-04-02
Vue2利用Axios发起请求的详细过程记录

目录前言Axios的安装和配置发起简单GET请求发起POST请求发起简单POST请求发起POST请求并携带参数(一)发起POST请求并携带参数(二)上传文件测试Axios的confi...

99+

2024-04-02
利用MySQL Shell安装部署MGR集群的详细过程

目录1. 安装准备2. 利用MySQL Shell构建MGR集群3. MySQL Shell接管现存的MGR集群4. 小结参考资料、文档免责声明本文介绍如何利用MySQL Shell...

99+

2024-04-02
利用vite创建vue3项目的全过程及一个小BUG详解

目录前言vite简介利用vite创建vue3项目结构目录一个小BUG总结前言 vite是一个web开发构建工具，由于其原生ES模块导入方式，可以实现闪电般的冷服务器启动。相对于web...

99+

2023-05-16

vite创建vue3项目命令 vite vue3 如何创建vue项目
ASP函数与过程：学会使用这两个利器，让你的编程更智能！

本文将重点介绍 ASP 函数和过程，包括这些代码结构的优点，以及如何在您的应用程序中使用它们。 ASP 函数 ASP 函数是可重用代码块，可以从其他 ASP 脚本或页面中调用。函数可以接受参数，并可以返回一个值。以下是 ASP 函数的示...

99+

2024-02-14

Keyword：ASP 函数 ASP 过程 ASP 代码复用 ASP 代码组织 ASP 代码管理
kernel利用pt regs劫持seq operations的迁移过程详解

目录劫持seq_operations进行栈迁移exp1利用pt_regsexp2劫持seq_operations进行栈迁移 seq_operations是一个大小为0x20...

99+

2024-04-02
SQL利用游标遍历日期查询的过程详解

需求：我有个存储过程，每次执行需要带入一个连续的日期。我想遍历执行出一个月的时间，怎么搞？我本来的想法是：程序里面写一个for循环，循环里面循环传日期去执行这个存储过程。但是同事...

99+

2024-04-02
封装一个更易用的Dialog组件过程详解

目录场景搭建环境创建组件创建调用组件的hook函数Dialog的缓存、隐藏隐藏缓存完整代码总结场景在项目中，我们经常会遇到使用弹窗的场景，但有时组件库自带的弹窗不能满足我们的需求，...

99+

2024-04-02
利用C#编写一个Windows服务程序的方法详解

1.添加引用Windows服务（.NET Framework） 2.输入项目名称，选择安装位置，,选择安装框架版本；创建。 3.找到MyService.cs ，右击‘...

99+

2023-03-14

C#编写Windows服务程序 C# Windows服务程序 C# Windows服务
使用 React 和 Threejs 创建一个VR全景项目的过程详解

最近我在学习使用 React 配合 Three.js 来搭建一个可以浏览720全景图片的项目实现的是加载一张 2:1 的720全景分享一下我的创建过程一、搭建框架并安装需要的插...

99+

2024-04-02
国庆节到了,利用JS实现一个生成国庆风头像的小工具详解实现过程

目录1. 页面布局2. 图片上传和展示3. 初始化画布4. 切换模板5. 输出图片这里用到的技术： HTML+ CSS+ JavaScript； download....

99+

2024-04-02