pandas分组排序如何获取第二大的数据

2024-04-02 19:04:59 627人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

python用来做数据分析很方便，网上很多关于找数据中第二大的方法，但是大多数都是关于sql的，于是我挑战一下用Python来做这件事（主要是SQL写的不好>_<）,上代

python用来做数据分析很方便，网上很多关于找数据中第二大的方法，但是大多数都是关于sql的，于是我挑战一下用Python来做这件事（主要是SQL写的不好>_<）,上代码。

1、数据我是自己编的

在实际工作中应该从数据库中导入数据，如何从数据库导出数据，我之后会补充。


import pandas as pd
df = pd.DataFrame([
    {"class": 1, "name": "aa", "english": 120},
    {"class": 1, "name": "bb", "english": 110},
    {"class": 1, "name": "cc", "english": 110},
    {"class": 1, "name": "dd", "english": 110},
    {"class": 2, "name": "ee", "english": 120},
    {"class": 2, "name": "ff", "english": 140},
    {"class": 2, "name": "gg", "english": 130},
    {"class": 2, "name": "hh", "english": 130},
    {"class": 3, "name": "tt", "english": 130},
    {"class": 4, "name": "xx", "english": 130},
    {"class": 4, "name": "yy", "english": 130},
    {"class": 5, "name": "zz", "english": None},
  ])

2、分组取第二大的数据


def fun(df):
  # english数据去重
  sort_set = set(df["english"].values.tolist())
  if len(sort_set)<=1:
    # 数据量小于等于1，无法取到第二大的数据
    return None
  else:
    # 取english中第二大的值
    sort_value = sorted(sort_set,reverse=True)[1]
    temp_df = df[df["english"]==sort_value]
    return temp_df
 
df = df.groupby(by=["class"]).apply(fun).reset_index(drop=True)
print(df)

结果如下：


  class name english
0 1 bb 110.0
1 1 cc 110.0
2 1 dd 110.0
3 2 gg 130.0
4 2 hh 130.0

3、写完啦，就这么简单

当然这还可以改为取最大、取最小、取第三大、等等......

补充：pandas 按某一列A排序，按B和C两列分组，选择分组后A列值最大的行

pandas 按某一列A排序，按B和C两列分组，选择分组后A列值最大的行

一、需求

按 updateTime 列倒序排序，按 B 和 C 两列分组，分组后选择最后更新的时间的那一行，并将结果加上新索引。

二、代码


import pandas as pd
data = pd.read_csv('test.csv')
df = pd.DataFrame(data)
df = df.sort_values('updateTime', ascending=False).groupby(['B','C']).first().reset_index()

first() 函数代表选择第一行，如果要选取多行，可以使用 head() 函数： head(5)表示选择前五行。

如下例：


import pandas as pd 
data = pd.read_csv('test.csv',header = 0)
df = pd.DataFrame(data) 
# 按日期分组，分组后对 value 列从大到小排序，取每组前十行
df = df.groupby('date', group_keys=False).apply(lambda x: x.sort_values('value', ascending=False)).groupby('date').head(10).reset_index()

在不能直接使用sort_values() 函数时，使用 apply() 函数。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。如有错误或未考虑完全的地方，望不吝赐教。

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: pandas分组排序如何获取第二大的数据

本文链接: https://www.lsjlt.com/news/122416.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

pandas分组排序如何获取第二大的数据

Python用来做数据分析很方便，网上很多关于找数据中第二大的方法，但是大多数都是关于SQL的，于是我挑战一下用Python来做这件事（主要是SQL写的不好>_<）,上代...

99+

2022-11-11
mysql分组排序取组内第一的数据行获取分组后，组内排名第一或最后的数据行。

前言： group by函数后取到的是分组中的第一条数据，但是我们有时候需要取出各分组的最新一条，该怎么实现呢？本文提供两种实现方式。一、准备数据 DROP TABLE IF EXISTS `tb_dept`;CREATE TA...

99+

2023-09-08

数据库 sql mysql
oracle数据库排序后如何获取第一条数据

目录oracle排序后如何获取第一条数据场景实现oracle分组后获取每组数据第一条数据总结oracle排序后如何获取第一条数据场景想要获取下列sql的数据的第一条 selec&...

99+

2023-02-28

oracle数据库 oracle数据库排序 oracle排序获取数据
oracle如何根据字段分组排序取其第一条数据

这篇文章主要介绍“oracle如何根据字段分组排序取其第一条数据”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“oracle如何根据字段分组排序取其第一条数据”文章能帮助大家解决问题。以某个字段分组 ...

99+

2023-07-05
pyodps中的apply用法及groupby取分组排序第一条数据

目录1、apply用法2、取分组排序后的第一条数据1、apply用法 apply在pandas里非常好用的，那在pyodps里如何去使用，还是有一些区别的，在pyodps中要对一行数...

99+

2022-11-11
三大数据库如何获取表中的第m条到第n条记录（n大于m）

1、oracle数据库：（注：tableName.id指的是tableName的主键）select * from (select tableName.*,rownum as con fr...

99+

2022-10-18
如何使用Python的pandas库获取DataFrame数据的最小值、最大值以及自定义分位数？

一、如何使用Python的pandas库获取DataFrame数据的最小值、最大值以及自定义分位数？ Pandas是一个非常流行的Python数据处理库，它提供了大量的方法和工具来处理和分析数据。在本...

99+

2023-09-29

pandas python 数据分析
【MySQL】如何在MySQL中获取表中的某个字段为最大值和倒数第二条的整条数据？

文章目录前言一、查询倒数第二个记录1.1、使用排名1.2、子查询1.3、嵌套查询二、下面为大家提供一个测试案例三、查询某个字段为最大值的整条数据3.1、使用max3.2、使用连接3.3...

99+

2023-10-27

mysql 数据库
小程序如何获取第三方平台自定义的数据字段

本文将为大家详细介绍“小程序如何获取第三方平台自定义的数据字段”，内容步骤清晰详细，细节处理妥当，而小编每天都会更新不同的知识点，希望这篇“小程序如何获取第三方平台自定义的数据字段”能够给你意想不到的收获，请大家跟着小编的思路慢慢深入，具体...

99+

2023-06-26
微信小程序如何获取第三方平台自定义的数据字段

这篇文章主要介绍了微信小程序如何获取第三方平台自定义的数据字段的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇微信小程序如何获取第三方平台自定义的数据字段文章都会有所收获，下面我们一起来看看吧。wx.getExt...

99+

2023-06-26
如何通过索引优化PHP与MySQL的数据排序和数据分组的效率？

在开发Web应用过程中，经常需要对数据进行排序和分组操作。而对于PHP与MySQL之间的数据排序和数据分组操作，我们可以通过索引来优化其效率。索引是一种数据结构，用于提高数据的检索速度。它可以加快数据的排序、分组以及查找操作。下面我们将介绍...

99+

2023-10-21

MySQL PHP 索引优化数据分组数据排序
小程序如何获取第三方平台自定义数据字段的同步接口

这篇“小程序如何获取第三方平台自定义数据字段的同步接口”除了程序员外大部分人都不太理解，今天小编为了让大家更加理解“小程序如何获取第三方平台自定义数据字段的同步接口”，给大家总结了以下内容，具有一定借鉴价值，内容详细步骤清晰，细节处理妥当，...

99+

2023-06-26