首页 > 资讯 > 精选 >Pandas怎么计算元素的数量和频率

452

分享到

Pandas怎么计算元素的数量和频率

2023-07-05 04:07:58 452人浏览八月长安

摘要

本篇内容介绍了“pandas怎么计算元素的数量和频率”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！在pandas.Series的pandas

本篇内容介绍了“pandas怎么计算元素的数量和频率”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

在pandas.Series的pandas.DataFrame列中，将描述获取唯一元素数（不包括重复项的案例数）和每个元素的出现频率（出现数）的方法。

使用pandas.Series方法的unique（），value_counts（）和nunique（）。还提供了nunique（）作为pandas.DataFrame的方法。

在这里:

pandas.Series.unique():返回NumPy数组ndarray中唯一元素值的列表
pandas.Series.value_counts():返回唯一元素的值及其在出现的次数。
pandas.Series.nunique(), pandas.DataFrame.nunique():返回int，pandas.Series中唯一元素的数量。

在解释了基本用法之后,对一下内容进行介绍。

唯一元素的数量（不包括重复项的）
唯一元素值列表
唯一元素的频率（出现次数）
独特元素及其出现的字典
模式及其频率
归一化频率

以下面的数据为例。

import pandas as pdimport numpy as npdf = pd.read_csv('./data/15/sample_pandas_nORMal.csv')df.iloc[1] = np.nanprint(df)#       name   age state  point# 0    Alice  24.0    NY   64.0# 1      NaN   NaN   NaN    NaN# 2  Charlie  18.0    CA   70.0# 3     Dave  68.0    TX   70.0# 4    Ellen  24.0    CA   88.0# 5    Frank  30.0    NY   57.0

pandas.Series.unique():返回NumPy数组ndarray中唯一元素值的列表

unique（）返回唯一元素值的列表。一维NumPy数组ndarray类型而不是列表类型（python内置类型）。还包括缺失值NaN。

u = df['state'].unique()print(u)print(type(u))# ['NY' nan 'CA' 'TX']# <class 'numpy.ndarray'>

pandas.Series.value_counts():返回唯一元素的值及其在出现的次数。

value_counts（）返回pandas.Series，其中唯一元素的值是index，出现的次数是data。当需要元素的频率（出现次数）时使用此选项。

vc = df['state'].value_counts()print(vc)print(type(vc))# NY    2# CA    2# TX    1# Name: state, dtype: int64# <class 'pandas.core.series.Series'>

默认情况下，它按出现次数的降序排序，但是如果参数ascending = True，则以升序排序，如果参数sort = False，则不进行排序。

print(df['state'].value_counts(ascending=True))# TX    1# CA    2# NY    2# Name: state, dtype: int64print(df['state'].value_counts(sort=False))# CA    2# NY    2# TX    1# Name: state, dtype: int64

默认情况下，NaN被排除，但如果参数dropna = False，则也计入NaN。

print(df['state'].value_counts(dropna=False))# NY     2# CA     2# TX     1# NaN    1# Name: state, dtype: int64

如果指定了参数normalize = True，则将值归一化，以使总数变为1。

请注意，如果包含缺失值NaN，则该值将根据参数dropna的设置而有所不同。

print(df['state'].value_counts(dropna=False, normalize=True))# NY     0.333333# CA     0.333333# TX     0.166667# NaN    0.166667# Name: state, dtype: float64

pandas.Series.nunique(), pandas.DataFrame.nunique():返回int，pandas.Series中唯一元素的数量。

pandas.Series.nunique（）以整数int形式返回唯一元素的数量。

默认情况下，不包含NaN，并且如果指定了参数dropna = False，则结果还将包含NaN。

nu = df['state'].nunique()print(nu)print(type(nu))# 3# <class 'int'>print(df['state'].nunique(dropna=False))# 4

pandas.DataFrame.nunique（）计算每列的唯一元素数。返回pandas.Series类型。

默认情况下，不包含NaN，并且如果指定了参数dropna = False，则结果还将包含NaN。

默认情况下，该值为每列，但是如果参数axis = 1或axis =‘columns’，则返回每行的值。

nu_col = df.nunique()print(nu_col)print(type(nu_col))# name     5# age      4# state    3# point    4# dtype: int64# <class 'pandas.core.series.Series'>print(df.nunique(dropna=False))# name     6# age      5# state    4# point    5# dtype: int64print(df.nunique(dropna=False, axis='columns'))# 0    4# 1    1# 2    4# 3    4# 4    4# 5    4# dtype: int64

唯一元素的数量（不包括重复项的）

如上所述，pandas.Series.nunique（）和pandas.DataFrame.nunique（）可以计算唯一元素的数量（唯一元素的数量）。

print(df['state'].nunique())# 3print(df.nunique())# name     5# age      4# state    3# point    4# dtype: int64

唯一元素值列表

使用unique（），您可以获取NumPy数组ndarray类型的唯一元素值的列表。如果要使用列表类型（Python内置类型），则可以使用tolist（）方法将其转换。

print(df['state'].unique().tolist())print(type(df['state'].unique().tolist()))# ['NY', nan, 'CA', 'TX']# <class 'list'>

可以将tolist（）方法应用于通过value_counts（）获得的pandas.Series的索引。也可以作为NumPy数组ndarray类型的值来获取。

print(df['state'].value_counts().index.tolist())print(type(df['state'].value_counts().index.tolist()))# ['NY', 'CA', 'TX']# <class 'list'>print(df['state'].value_counts(dropna=False).index.values)print(type(df['state'].value_counts().index.values))# ['NY' 'CA' 'TX' nan]# <class 'numpy.ndarray'>

如上所述，在unique（）的情况下，始终包含NaN，但是value_counts（）可以指定参数dropna是否包含NaN。

唯一元素的频率（出现次数）

要获取每个唯一元素的频率（出现次数），请访问通过value_counts（）获得的pandas.Series的值。

print(df['state'].value_counts()['NY'])# 2print(df['state'].value_counts().NY)# 2

使用iteritems（）方法检索for循环中的元素值和频率（出现次数）。

for index, value in df['state'].value_counts().iteritems():    print(index, ': ', value)# NY :  2# CA :  2# TX :  1

独特元素及其出现的字典

也可以将to_dict（）方法应用于value_counts（）获得的pandas.Series使其成为字典。

d = df['state'].value_counts().to_dict()print(d)print(type(d))# {'NY': 2, 'CA': 2, 'TX': 1}# <class 'dict'>print(d['NY'])# 2

使用items（）方法在for循环中检索元素值和频率（出现次数）。

for key, value in d.items():    print(key, ': ', value)# NY :  2# CA :  2# TX :  1

模式及其频率

默认情况下，value_counts（）返回pandas.Series，它以出现次数的降序排列，因此顶部是最频繁出现的值及其频率。

print(df['state'].value_counts())# NY    2# CA    2# TX    1# Name: state, dtype: int64print(df['state'].value_counts().index[0])# NYprint(df['state'].value_counts().iat[0])# 2

原始pandas.Series的元素成为所得pandas.Series的索引。当数值为索引时，无法使用[Number]指定该值（这会导致错误），因此严格使用iat [Number]进行指定。（由于示例是字符串，因此[Number]无关紧要）

使用apply（）方法将其应用于pandas.DataFrame的每一列。

Pandas中map(),applymap(),apply()函数的使用方法

print(df.apply(lambda x: x.value_counts().index[0]))# name     Frank# age         24# state       NY# point       70# dtype: objectprint(df.apply(lambda x: x.value_counts().iat[0]))# name     1# age      2# state    2# point    2# dtype: int64

如果存在多种模式，则上述方法只能获得一种模式。

mode()

pandas.Series的mode（）方法将模式值返回为pandas.Series。如果使用tolist（）列出此结果，则可以将模式值作为列表获取。请注意，即使只有一种模式，也将是一个列表。

print(df['state'].mode())# 0    CA# 1    NY# dtype: objectprint(df['state'].mode().tolist())# ['CA', 'NY']print(df['age'].mode().tolist())# [24.0]

使用apply（）方法将mode（）应用于每列将产生具有列表类型元素的pandas.Series（）。

s_mode = df.apply(lambda x: x.mode().tolist())print(s_mode)# name     [Alice, Charlie, Dave, Ellen, Frank]# age                                    [24.0]# state                                [CA, NY]# point                                  [70.0]# dtype: objectprint(type(s_mode))# <class 'pandas.core.series.Series'>print(s_mode['name'])# ['Alice', 'Charlie', 'Dave', 'Ellen', 'Frank']print(type(s_mode['name']))# <class 'list'>

mode（）也作为pandas.DataFrame的方法提供。返回pandas.DataFrame。由于各列的模式数不同，所以空缺部分成为缺失值NaN。

print(df.mode())#       name   age state  point# 0    Alice  24.0    CA   70.0# 1  Charlie   NaN    NY    NaN# 2     Dave   NaN   NaN    NaN# 3    Ellen   NaN   NaN    NaN# 4    Frank   NaN   NaN    NaN

可以使用count（）方法获得每列中的模式数，该方法对不缺少值NaN的元素数进行计数。

print(df.mode().count())# name     5# age      1# state    2# point    1# dtype: int64

describe()

同样，正如我在开始时所写的那样，describe（）方法可用于共同计算每一列的唯一元素的数量，模式值及其频率（出现的次数）。每个项目都可以使用loc []获得。

print(df.astype('str').describe())#          name   age state point# count       6     6     6     6# unique      6     5     4     5# top     Frank  24.0    CA  70.0# freq        1     2     2     2print(df.astype('str').describe().loc['top'])# name     Frank# age       24.0# state       CA# point     70.0# Name: top, dtype: object

在describe（）中，由列类型dtype计算出的项是不同的，因此使用astype（）进行类型转换（转换）。

归一化频率

如上所述，当将value_counts（）的参数归一化设置为True时，将归一化以使总数变为1的值被返回。

请注意，如果包含缺失值NaN，则该值将根据参数dropna的设置而有所不同。

比较多个数据的频率分布时，很方便。

print(df['state'].value_counts(dropna=False, normalize=True))# NY     0.333333# CA     0.333333# TX     0.166667# NaN    0.166667# Name: state, dtype: float64

“Pandas怎么计算元素的数量和频率”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站，小编将为大家输出更多高质量的实用文章！

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Pandas怎么计算元素的数量和频率

本文链接: https://www.lsjlt.com/news/349728.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Pandas怎么计算元素的数量和频率

本篇内容介绍了“Pandas怎么计算元素的数量和频率”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！在pandas.Series的pandas...

99+

2023-07-05
Pandas计算元素的数量和频率的方法(出现的次数)

目录pandas.Series.unique():返回NumPy数组ndarray中唯一元素值的列表pandas.Series.value_counts():返回唯一元素的值及其在出...

99+

2023-02-22

Pandas计算元素数量 Pandas计算元素频率 Pandas计算元素
使用R语言怎么计算频数和频率

本篇文章为大家展示了使用R语言怎么计算频数和频率，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。什么是R语言R语言是用于统计分析、绘图的语言和操作环境，属于GNU系统的一个自由、免费、源代码开放的软件...

99+

2023-06-14
PHP怎么计算数组元素总和

这篇文章主要介绍“PHP怎么计算数组元素总和”，在日常操作中，相信很多人在PHP怎么计算数组元素总和问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”PHP怎么计算数组元素总和”的疑惑有所帮助！接下来，请跟着小编...

99+

2023-06-20
R语言-计算频数和频率的操作

首先，筛选出需要的列： data <- data2[,which(colnames(data2) %in% c("产品分类", "期数", "逾期月数"))] ...

99+

2024-04-02
怎么在python中统计列表中元素出现的频率

这期内容当中小编将会给大家带来有关怎么在python中统计列表中元素出现的频率，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。python主要应用领域有哪些1、云计算，典型应用OpenStack。2、WEB...

99+

2023-06-14
python怎么计算数组元素个数

Python中，可以使用内置函数`len()`来计算数组的元素个数。以下是一个示例：```pythonarr = [1, 2, 3,...

99+

2023-08-22

python
PHP怎么计算数组元素乘积

这篇文章主要介绍“PHP怎么计算数组元素乘积”，在日常操作中，相信很多人在PHP怎么计算数组元素乘积问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”PHP怎么计算数组元素乘积”的疑惑有所帮助！接下来，请跟着小编...

99+

2023-06-20
PHP如何计算数组元素总和

本篇内容主要讲解“PHP如何计算数组元素总和”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“PHP如何计算数组元素总和”吧!本篇文章来看看如何计算数组中所以元素之后，给大家介绍3钟方法：for循环...

99+

2023-06-20
php用数组元素怎么计算器

随着计算机技术的不断发展，越来越多的程序员开始使用PHP编写web应用程序。PHP有一个非常强大的数据结构——数组，它可以用来存储一组数据，并且可以使用数组元素进行计算器。本文将介绍如何使用PHP中的数组元素来进行计算器的操作。数组元素的定...

99+

2023-05-19
javascript一维数组元素的和的计算方法

这篇文章将为大家详细讲解有关javascript一维数组元素的和的计算方法，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。方法：1、用“for(var i=0;i<数...

99+

2024-04-02
怎么用JavaScript获取和计算页面元素的offset

这篇文章主要介绍“怎么用JavaScript获取和计算页面元素的offset”，在日常操作中，相信很多人在怎么用JavaScript获取和计算页面元素的offset问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答...

99+

2023-06-08
JavaScript中怎么计算元素的位置

这篇文章给大家介绍JavaScript中怎么计算元素的位置，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。1、js计算相对于浏览器视窗的元素绝对位置<!DOCTYPE h...

99+

2024-04-02
java中Count怎么计算流中的元素

这篇文章将为大家详细讲解有关java中Count怎么计算流中的元素，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。Java可以用来干什么Java主要应用于：1. web开发；2. Android开发；3. ...

99+

2023-06-14
Python统计序列和文件中元素的频度

目录1、如何统计序列中元素的出现频度2、代码演示1、如何统计序列中元素的出现频度实际案例：（1）某随机序列[12, 5, 6, 4, 6, 5, 5, 7, ...] 中找到出现...

99+

2024-04-02
PHP怎么计算数据流中的第K大的元素

这篇文章主要讲解了“PHP怎么计算数据流中的第K大的元素”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“PHP怎么计算数据流中的第K大的元素”吧！利用最小堆的性质，该最小堆的根结点一定是所有结...

99+

2023-06-20
Python怎么统计序列中元素的出现频度

今天小编给大家分享一下Python怎么统计序列中元素的出现频度的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。1、如何统计序列...

99+

2023-06-30
怎么获得css元素中的计算样式

这篇文章主要讲解了“怎么获得css元素中的计算样式”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“怎么获得css元素中的计算样式”吧！要获得css元素中的计算样式(即经过层叠之后，最终的样式)...

99+

2023-06-08
java8怎么实现分组计算数量和计算总数

本篇内容介绍了“java8怎么实现分组计算数量和计算总数”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！java8分组计算数量和计算总数pac...

99+

2023-06-20
Python中怎么统计序列中元素的出现频度

这篇文章将为大家详细讲解有关Python中怎么统计序列中元素的出现频度，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。某随机序列中，找到出现次数最高的三个元素，他们的出现次数是多少？对某英文文...

99+

2023-06-02