iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python groupby函数图文详解
  • 300
分享到

Python groupby函数图文详解

2024-04-02 19:04:59 300人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

一、分组原理 核心: 1、不论分组键是数组、列表、字典、Series、函数,只要其与待分组变量的轴长度一致都可以传入groupby进行分组。 2、默认axis=0按行分组,可指定ax

一、分组原理

核心:

1、不论分组键是数组、列表、字典、Series、函数,只要其与待分组变量的轴长度一致都可以传入groupby进行分组。

2、默认axis=0按行分组,可指定axis=1对列分组。

groupby()语法格式

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, group_keys=True, squeeze=False,  observed=False, **kwargs)

groupby原理

groupby就是按XX分组,比如将一个数据集按A进行分组,效果如下

使用groupby实现功能

import numpy as np
import pandas as pd
 
data = pd.DataFrame({
    'name': ['Tom', 'Kaggle', 'Litter', 'Sam', 'Sam', 'Sam'],
    'race': ['B', 'C', 'D', 'E', 'B', 'C'],
    'age': [37.0, 61.0, 56.0, 87.0, 58.0, 34.0],
    'signs_of_mental_illness': [True, True, False, False, False, False]
})
 
data.groupby('race')

 返回结果如上  得到一个叫DataFrameGroupBy的东西,pandas不能直接显示出来 可以调用list显示出来

groupby()的配合函数 函数 适用场景备注.mean()均值.count()计数.min()最小值.mean().unstack()求均值,聚合表的层次索引不堆叠.size()计算分组大小GroupBy的size方法,将返回一个含有分组大小的Series.apply().agg()

这里演示.mean()和.count()

# mean()
data.groupby('name')['age'].mean()
# count()
data.groupby('name')['age'].count()
data.groupby('age').count()

 也可以根据单键多列进行聚合

# 单键多列聚合
data.groupby('name')[['race','age',]].count()

 .agg操作 可以取多个函数进行选择 有时候我们既需要平均值,有需要计数(也可是取一个)

agg为列表

print(data.groupby('name')['age'].agg(['mean']))
 
print(data.groupby('name')['age'].agg(['mean','count']))

也可以传入字典,对组内不同列采取不同的操作

print(data.groupby('race').agg({'age': np.median, 'signs_of_mental_illness': np.mean}))

.apply()

可以使用我们自己所创建的函数

print('apply之前')
grouped = data.groupby('name')
for name, group in grouped:
    print(name)
    print(group)
print('\n')
print('apply之后')
print(data.groupby('name').apply(lambda x: x.head(2)))

 简单操作基本介绍完成

有时候需要将聚合的另一列放到一起 并且取消键的重复值 这个时候可以这样做

上面是构建的数据,需要对订购时间进行处理,这里我们是将月份+天数/30,然后对ID列进行去重,并将后面Time列计算的结果放到一起

import numpy as np
import pandas as pd
 
 
data = pd.read_excel('订购时间预测2.xlsx')
def cut_m_d(x):
	return round(x.month + x.day / 30, 2)
 
data['m_d'] = data['Time'].apply(cut_m_d)
grouped = data.groupby('ID')
# 这一步是去重(ID),不去重会出现错误
result = grouped['m_d'].unique()
result2 = result.reset_index()
print(result2)

总结

到此这篇关于python groupby函数详解的文章就介绍到这了,更多相关groupby函数详解内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python groupby函数图文详解

本文链接: https://www.lsjlt.com/news/119239.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python groupby函数图文详解
    一、分组原理 核心: 1、不论分组键是数组、列表、字典、Series、函数,只要其与待分组变量的轴长度一致都可以传入groupby进行分组。 2、默认axis=0按行分组,可指定ax...
    99+
    2024-04-02
  • python中groupby()函数讲解
    # -*- coding: utf-8 -*- import pandas as pd import numpy as np df = pd.DataFrame({'key1':list('aabba'), ...
    99+
    2023-01-31
    函数 python groupby
  • Python中groupby函数详解(非常容易懂)
    目录:Python中的groupby函数 一、groupby 能做什么?二、单类分组2.1 创建数据集 三、多类分组 一、groupby 能做什么? groupby函数主要的作用是进行...
    99+
    2023-09-12
    python pandas groupby
  • 聚合函数和groupby的关系详解
    目录前言聚合函数介绍group by介绍解释聚合函数和group by的关系使用group by和聚合函数需要注意的地方总结前言 world:世界表格continent:大洲名称na...
    99+
    2024-04-02
  • python中groupby函数如何使用
    在Python中,groupby函数是通过pandas库的DataFrame对象使用的。该函数用于根据一个或多个列对数据进行分组。下...
    99+
    2023-09-20
    python
  • Pandas数据分析之groupby函数用法实例详解
    目录正文一、了解groupby二、数据文件简介三、求各个商品购买量四、求各个商品转化率五、转化率最高的30个商品及其转化率小小の总结正文 今天本人在赶学校课程作业的时候突然发现gro...
    99+
    2024-04-02
  • pytorch中的torch.nn.Conv2d()函数图文详解
    目录一、官方文档介绍二、torch.nn.Conv2d()函数详解参数dilation——扩张卷积(也叫空洞卷积)参数groups——...
    99+
    2024-04-02
  • Oracle中pivot函数图文实例详解
    目录【基本介绍】【准备样例数据】【样例展示1】【样例展示2】【样例展示3】【样例展示4】【样例展示5】【样例展示6】总结【基本介绍】 【格式】:pivot(聚合函数 for 需要转为列的字段名 in(需要转为列的字段值)...
    99+
    2023-05-12
    oracle行转列函数pivot oracle pivot oracle pivot函数
  • 图文详解Python中最神秘的一个魔法函数
    目录前言1、有点价值的missing()2、神出鬼没的missing()3、被施魔法的missing()4、小结5、总结前言 一个非常神秘的魔术方法。 这个方法非常不起眼,用途狭窄,...
    99+
    2024-04-02
  • Python文件读写open函数详解
    前言: open()函数的定义:def open(file, mode='r', buffering=None, encoding=None, errors=None...
    99+
    2024-04-02
  • 一文详解Python中的super 函数
    目录实战场景实战编码单继承使用实战场景 经常有朋友问,学 Python 面向对象时,翻阅别人代码,会发现一个 super() 函数,那这个函数的作用到底是什么? super() 函数...
    99+
    2024-04-02
  • 图文详解vue中proto文件的函数调用
    1、编译proto 在src文件夹下新建proto文件夹用以存放所有的.proto文件。在proto文件夹下打开终端,输入如下命令: //进入proto文件夹执行下列编译,将he...
    99+
    2024-04-02
  • C++函数重载的细节图文详解
    前言:如果不想看论证,可以直接点击总结,跳转到最后 1、使用重载函数时,如果数据类型不匹配,C++尝试使用类型转换与形参进行匹配,如果转换后有多个函数能匹配上,编译器将报错; 论证如...
    99+
    2022-12-10
    c++函数重载例子 C++函数重载是什么 重载函数怎么写
  • python函数详解
    结构:    def  函数名():        函数体执行:    函数名()返回值:    return    一,函数中,遇到return终止函数    二,返回值,返回给了函数的调用者:函数名()    return单个值,返回单...
    99+
    2023-01-31
    详解 函数 python
  • Python Matplotlib绘制箱线图boxplot()函数详解
    目录箱线图boxplot()函数还提供了丰富的自定义选项箱线图通常用在多组数据比较时补充:plt.boxplot()函数绘制箱图、常用方法实战常用方法总结 箱线图 箱线图一...
    99+
    2024-04-02
  • Python Open函数详解
    这里写目录标题 一级目录二级目录三级目录1、文件IO的常见操作2、打开操作Open2.1 file 文件名2.2 mode 模式2.2.1. R模式:mode = "r"2.2.2. W模式:...
    99+
    2023-10-24
    python 开发语言 linux
  • Python isalpha()函数详解
    「作者主页」:士别三日wyx 「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:小白零基础《Python入门到精通》 isalpha...
    99+
    2023-10-23
    python 网络安全 人工智能 机器学习
  • Python count()函数详解
    「作者主页」:士别三日wyx 「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》 ...
    99+
    2024-01-21
    人工智能 网络安全 ai
  • python DataFrame数据分组统计groupby()函数的使用
    目录groupby()函数1. groupby基本用法1.1 一级分类_分组求和1.2 二级分类_分组求和1.3 对DataFrameGroupBy对象列名索引(对指定列统计计算)2...
    99+
    2024-04-02
  • python常用函数random()函数详解
    目录random()random.seed()randint()random() 方法返回随机生成的一个实数,它在[0,1)范围内。 random() 返回随机生成的一个实...
    99+
    2023-02-22
    python random()函数 python random
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作