iis服务器助手广告广告
返回顶部
首页 > 资讯 > 精选 >Pandas如何实现DataFrame运算、统计与排序操作
  • 868
分享到

Pandas如何实现DataFrame运算、统计与排序操作

2023-06-29 18:06:59 868人浏览 泡泡鱼
摘要

这篇文章主要介绍pandas如何实现DataFrame运算、统计与排序操作,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!由于DataFrame的数据结构中包含了多行、多列,所以DataFrame的计算与统计可以是用行

这篇文章主要介绍pandas如何实现DataFrame运算、统计与排序操作,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

由于DataFrame的数据结构中包含了多行、多列,所以DataFrame的计算与统计可以是用行数据或者用列数据。为了更方便我们的使用,Pandas为我们提供了常用的计算与统计方法:

操作方法操作方法
求和sum最大值max
求均值mean最小值min
求方差var标准差std
中位数median众数mode
分位数quantile  

一.运算

接上文的例子,我们已经有了N个学生的数学、语文、英语的成绩表,现在,我们要算出每个学生的总成绩,那么我们就可以用以下的方法:

'''行的求和以下演示两种方法:方法1:先把待求和的列数据删选出来(剔除掉name列),然后使用sum函数求和方法2:把待求和的列一个一个选出来然后使用运算符求和两种方法最后的结果为像原有的DataFrame中新增一列,数据为每行数据的求和'''df['sum'] = df[['chinese', 'math', 'english']].sum(1)#方法1df['sum'] = df['chinese'] + df['math'] + df['english']#方法2Output:        name  chinese  english  math  sum0   XiaoMing       99      100    80  2791      LiHua      102       79    92  2732  HanMeiNei      111      130   104  345

在sum方法中我们传入了参数1,代表的是我们使用的轴(axis)为行(对行数据进行求和),如果想要计算出每列的求和我们只用传入0即可(sum函数默认参数为0,所以也可不传):

df[['chinese', 'math', 'english']].sum(0)Output:chinese    312math       276english    309dtype: int64

现在有了总成绩,那么数学老师或者语文老师就会关心本班学生的数据平均分是多少,同样的,我们可以非常快速的计算出来:

df['math'].mean()#方法一:直接使用Pandas提供的mean求均值方法df['math'].sum() / df.shape[0]#方法二:使用求和方法算出总和后除以总人数(行数)Output:92.0

本????中使用了DataFrame的shape方法,这个方法是用来显示DataFrame的行数和列数的,行数为0,列数1。需要注意的是输出的列数值是不含索引列的。

上述????只计算了数学的平均分,感兴趣的小伙伴可以自行基础出英语和语文的平均分哦~

二.统计

这个时候数学老师又有新的需求了,他想查看本班学生数学成绩的最高分、最低分、中位数等统计数据,那么根本不慌,Pandas统统可以帮我们搞定:

df['math'].min()  # math列的最小值Output:80df['math'].max()  # math列的最大值Output:104df['math'].quantile([0.3, 0.4, 0.5])  # math列的30%、40%、50%分位数Output:0.3    87.20.4    89.60.5    92.0Name: math, dtype: float64df['math'].std() # math列的标准差Output:12df['math'].var() # math列的方差Output:144df['math'].mean() # math列的平均数Output:92df['math'].median() # math列的中位数Output:92df['math'].mode() # math列的众数,返回一个Series对象(有可能出现并列的情况,例子中众数为1,所以都返回)Output:0     801     922    104dtype: int64

我们也可以使用DataFrame的describe方法对DataFrame查看基本的统计情况:

df.describe()Outprint:          chinese     english   math         sumcount    3.000000    3.000000    3.0    3.000000mean   104.000000  103.000000   92.0  299.000000std      6.244998   25.632011   12.0   39.949969min     99.000000   79.000000   80.0  273.00000025%    100.500000   89.500000   86.0  276.00000050%    102.000000  100.000000   92.0  279.00000075%    106.500000  115.000000   98.0  312.000000max    111.000000  130.000000  104.0  345.000000

三.排序

一般来讲我们的成绩表都是按照总分从高到低进行排序:

df = df.sort_values(by='sum', ascending=False)Output:        name  chinese  english  math  sum2  HanMeiNei      111      130   104  3450   XiaoMing       99      100    80  2791      LiHua      102       79    92  273

可以看到我们使用了sort_values方法对DataFrame进行排序,同时by参数传入‘sum’指定按照‘sum’字段进行排序,ascending用来设置是降序(False)还是升序(True,默认值)排序。使用sort_values排序后默认会返回一个新的DataFrame对象,也就是说并不会影响原有的DataFrame对象,所以例子中我们才会把排序后的对象赋值给原有的DataFrame对象,如果不想排序后创建新的对象也是可以的,只需要传入inplace=True即可(在原有的DataFrame基础上修改):

df.sort_values(by='sum', ascending=False, inplace=True)print(df)Output:        name  chinese  english  math  sum2  HanMeiNei      111      130   104  3450   XiaoMing       99      100    80  2791      LiHua      102       79    92  273

细心的小伙伴可能会发现当我们进行排序后,如果DataFrame中的行数据有调整的话,其行的索引值是不会更改的,上述例子中因为我们用了默认的递增数列索引,所以排序后看起来并不是很友好,不过不用担心,我们还是可以重置索引值的:

df = df.sort_values(by='sum', ascending=False).reset_index()Output:   index       name  chinese  english  math  sum0      2  HanMeiNei      111      130   104  3451      0   XiaoMing       99      100    80  2792      1      LiHua      102       79    92  273

使用reset_index重设索引后我们的DataFrame对象的索引列确实被重置成了递增的序列,同时也多了列名为index的一列数据。当然我们可以传入drop=True将原有的索引列不插入到新的DataFrame中:

df = df.sort_values(by='sum', ascending=False).reset_index(drop=True)        name  chinese  english  math  sum0  HanMeiNei      111      130   104  3451   XiaoMing       99      100    80  2792      LiHua      102       79    92  273

为了更直观的展示排名情况,我们可以索引值+1这样就展示出了学生的排名情况:

df.index += 1        name  chinese  english  math  sum1  HanMeiNei      111      130   104  3452   XiaoMing       99      100    80  2793      LiHua      102       79    92  273

以上是“Pandas如何实现DataFrame运算、统计与排序操作”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注编程网精选频道!

--结束END--

本文标题: Pandas如何实现DataFrame运算、统计与排序操作

本文链接: https://www.lsjlt.com/news/326097.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Pandas如何实现DataFrame运算、统计与排序操作
    这篇文章主要介绍Pandas如何实现DataFrame运算、统计与排序操作,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!由于DataFrame的数据结构中包含了多行、多列,所以DataFrame的计算与统计可以是用行...
    99+
    2023-06-29
  • Pandas实现DataFrame的简单运算、统计与排序
    目录一.运算二.统计三.排序在前面的章节中,我们讨论了Series的计算方法与Pandas的自动对齐功能。不光是Series,DataFrame也是支持运算的,而且还是经常被使用的功...
    99+
    2024-04-02
  • Java排序算法之计数排序如何实现
    这篇文章主要为大家展示了“Java排序算法之计数排序如何实现”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Java排序算法之计数排序如何实现”这篇文章吧。计数排序是非比较的排序算法,用辅助数组对...
    99+
    2023-06-21
  • pandas中groupby操作如何实现
    本文小编为大家详细介绍“pandas中groupby操作如何实现”,内容详细,步骤清晰,细节处理妥当,希望这篇“pandas中groupby操作如何实现”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。一、实验目的熟...
    99+
    2023-07-05
  • 如何实现计数排序
    这篇文章主要介绍“如何实现计数排序”,在日常操作中,相信很多人在如何实现计数排序问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何实现计数排序”的疑惑有所帮助!接下来,请跟着...
    99+
    2024-04-02
  • Java排序算法之堆排序如何实现
    这篇文章主要介绍了Java排序算法之堆排序如何实现,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。二叉堆是完全二叉树或者是近似完全二叉树。二叉堆满足二个特性︰1.父结点的键值总...
    99+
    2023-06-21
  • Java如何实现冒泡排序与选择排序
    小编给大家分享一下Java如何实现冒泡排序与选择排序,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一.冒泡排序1.概念冒泡排序这种排序方法其实关键词就在于冒泡两个...
    99+
    2023-06-22
  • 操作系统与实时操作系统的融合:创造下一代计算体验
    融合的好处 操作系统和实时操作系统的融合提供了以下好处: 实时响应:RTOS 提供确定性响应,确保对关键任务事件的快速处理。与 RTOS 融合后,OS 可以获得这种实时性,从而为需要即时性和可靠性的应用提供支持。 高吞吐量:OS 能够处...
    99+
    2024-04-02
  • JavaScript中如何实现冒泡排序与选择排序
    JavaScript中如何实现冒泡排序与选择排序,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1、冒泡排序算法冒泡算法顾名思义,可以将待排...
    99+
    2024-04-02
  • C#算法中如何实现冒泡排序、插入排序、选择排序
    这篇文章主要介绍了C#算法中如何实现冒泡排序、插入排序、选择排序,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。冒泡排序法是数组等线性排列的数字从大到小或从小到大排序。以从小到...
    99+
    2023-06-26
  • JS如何实现冒泡排序算法
    这篇文章主要介绍了JS如何实现冒泡排序算法,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1. 算法步骤比较相邻的元素。如果第一个比第二个大,...
    99+
    2024-04-02
  • C++如何实现归并排序算法
    这篇文章将为大家详细讲解有关C++如何实现归并排序算法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。归并算法开始首先要对一段要有序的数字进行排序void merg_sort(int* ...
    99+
    2023-06-25
  • JavaScript如何实现十大排序算法
    本文小编为大家详细介绍“JavaScript如何实现十大排序算法”,内容详细,步骤清晰,细节处理妥当,希望这篇“JavaScript如何实现十大排序算法”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,...
    99+
    2024-04-02
  • C++如何实现希尔排序算法
    这篇“C++如何实现希尔排序算法”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“C++如何实现希尔排序算法”文章吧。1.代码模...
    99+
    2023-06-26
  • PHP如何实现常见排序算法
    本篇内容介绍了“PHP如何实现常见排序算法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1、冒泡排序两两相比,每循环一轮就不用再比较最后一个...
    99+
    2023-07-01
  • java如何实现快速排序算法
    这篇文章将为大家详细讲解有关java如何实现快速排序算法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。快速排序算法使用的分治法策略来把一个序列分为两个子序列来实现排序的思路:1.从数列中挑出一个元素,称为...
    99+
    2023-06-02
  • c语言如何实现排序算法
    小编给大家分享一下c语言如何实现排序算法,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1.选择排序-简单选择排序选择排序是最简单的一种基于O(n2)时间复杂度的排...
    99+
    2023-06-15
  • Vue中如何实现列表渲染,排序,过滤操作
    这篇文章主要为大家展示了“Vue中如何实现列表渲染,排序,过滤操作”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Vue中如何实现列表渲染,排序,过滤操作”这篇文章吧。1. 列表(渲染、排序、过滤...
    99+
    2023-06-29
  • 如何在Java与Python实现一个归并排序算法
    如何在Java与Python实现一个归并排序算法?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。归并排序里运用到算法里很重要的一个思想——分治法:将原问题分解为几个规模较小但...
    99+
    2023-05-31
    归并排序 java python
  • JavaScript基于DOM操作如何实现数学运算功能
    这篇文章主要介绍了JavaScript基于DOM操作如何实现数学运算功能,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。具体如下:<!D...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作