首页 > 资讯 > 后端开发 > Python >python基础篇之pandas常用基本函数汇总

348

分享到

python基础篇之pandas常用基本函数汇总

2024-04-02 19:04:59 348人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

目录前言1、汇总函数2、特征统计函数3、唯一值函数4、替换函数总结前言这篇主要整理pandas常用的基本函数，主要分为五部分：汇总函数特征统计函数唯一值函数替换函数排序函数 1、

前言

这篇主要整理pandas常用的基本函数，主要分为五部分：

汇总函数
特征统计函数
唯一值函数
替换函数
排序函数

1、汇总函数

常用的主要是4个：

tail(): 返回表或序列的后n行
head(): 返回表或序列的前n行
info(): 返回表的信息概况
describe(): 返回表中数值列对应的主要统计量

n默认为5

df.describe()

#运行截图
	Height	Weight
count	183.000000	189.000000
mean	163.218033	55.015873
std	8.608879	12.824294
min	145.400000	34.000000
25%	157.150000	46.000000
50%	161.900000	51.000000
75%	167.500000	65.000000
max	193.900000	89.000000

2、特征统计函数

在Series和DataFrame上定义了许多统计函数，最常见的是：

sum
mean （均值）
median （中位数）
var （方差）
std （标准差）
max
min

用法示例

df_demo = df[['Height', 'Weight']]
df_demo.mean()

聚合函数

quantile (返回分位数)
count （返回非缺失值个数）
idxmax （最大值对应的索引）

聚合函数，有一个公共参数axis，axis=0代表逐列聚合，axis=1表示逐行聚合

df_demo.mean(axis=1).head()

3、唯一值函数

唯一值函数常用的四个函数：

unique() : 得到唯一值组成的列表->统计出指定列唯一存在的值有哪些
nunique() ：唯一值的个数->统计出指定列唯一存在的值总共有多少个
value_counts() ：得到唯一值和其对应出现的频数
drop_duplicates() ：去重
duplicated()

drop_duplicates()基本用法

关键参数keep
first ：保留第一次出现的重复行，删除后面的重复行
last ：删除重复项，除了最后一次出现
False：把所有重复组合所在的行剔除。

需要指定列

代码：

#原本的数据样例
df_demo = df[['Gender','Transfer','Name']]
df_demo

    Gender    Transfer    Name
0    Female    N    Gaopeng Yang
1    Male    N    Changqiang You
2    Male    N    Mei Sun
3    Female    N    Xiaojuan Sun
4    Male    N    Gaojuan You
...    ...    ...    ...
195    Female    N    Xiaojuan Sun
196    Female    N    Li Zhao
197    Female    N    Chengqiang Chu
198    Male    N    Chengmei Shen
199    Male    N    Chunpeng Lv
200 rows × 3 columns

#现给Gender,Transfer两列去重
df_demo.drop_duplicates(['Gender','Transfer'])

    Gender    Transfer    Name
0    Female    N    Gaopeng Yang
1    Male    N    Changqiang You
12    Female    NaN    Peng You
21    Male    NaN    Xiaopeng Shen
36    Male    Y    Xiaojuan Qin
43    Female    Y    Gaoli Feng

由此可见，使用了first参数，保留第一次出现的重复行，删除后面的重复行

在未指定参数的情况下，keep默认first；

指定last

案例如下:

df_demo.drop_duplicates(['Gender', 'Transfer'], keep='last')

    Gender    Transfer    Name
147    Male    NaN    Juan You
150    Male    Y    Chengpeng You
169    Female    Y    Chengquan Qin
194    Female    NaN    Yanmei Qian
197    Female    N    Chengqiang Chu
199    Male    N    Chunpeng Lv

last:删除所有的重复行，只保留出现的最后一个

drop_duplicates() & duplicated()的区别

duplicated和drop_duplicates的功能类似，但前者返回了是否为唯一值的布尔列表，其keep参数与后者一致。其返回的序列，把重复元素设为True，否则为False。 drop_duplicates等价于把duplicated为True的对应行剔除。

4、替换函数

替换函数有三类：

映射函数：replace()…
逻辑函数：（1）where （2）mask
数值替换

replace的用法

#原本的数据
df_demo = df[['Gender','Transfer','Name']]
df_demo

    Gender    Transfer    Name
0    Female    N    Gaopeng Yang
1    Male    N    Changqiang You
2    Male    N    Mei Sun
3    Female    N    Xiaojuan Sun
4    Male    N    Gaojuan You
...    ...    ...    ...
195    Female    N    Xiaojuan Sun
196    Female    N    Li Zhao
197    Female    N    Chengqiang Chu
198    Male    N    Chengmei Shen
199    Male    N    Chunpeng Lv
200 rows × 3 columns

#替换Gender，女替换为0，男替换为1
df['Gender'].replace({'Female':0, 'Male':1}).head()

0    0
1    1
2    1
3    0
4    1
Name: Gender, dtype: int64

逻辑替换

逻辑替换包括了where和mask，这两个函数是完全对称的：where函数在传入条件为False的对应行进行替换，而mask在传入条件为True的对应行进行替换，当不指定替换值时，替换为缺失值（NAN）

s = pd.Series([-1, 1.2345, 100, -50])
s.where(s<0)

0    -1.0
1     NaN
2     NaN
3   -50.0
dtype: float64

s.where(s<0, 100)

0     -1.0
1    100.0
2    100.0
3    -50.0
dtype: float64

s.mask(s<0)

0         NaN
1      1.2345
2    100.0000
3         NaN
dtype: float64

总结

到此这篇关于Python基础篇之pandas常用基本函数汇总的文章就介绍到这了,更多相关python pandas常用函数内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: python基础篇之pandas常用基本函数汇总

本文链接: https://www.lsjlt.com/news/119128.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

python基础篇之pandas常用基本函数汇总

目录前言1、汇总函数2、特征统计函数3、唯一值函数4、替换函数总结前言这篇主要整理pandas常用的基本函数，主要分为五部分：汇总函数特征统计函数唯一值函数替换函数排序函数 1、...

99+

2022-11-11
Python基础篇之字符串的最全常用操作方法汇总

目录前言：字符串的最全常用操作方法string.capitalize()string.upper()string.lower()string.swapcase()...

99+

2022-11-13
Python基础之数据类型知识汇总

目录一、数字类型二、字符串类型三、布尔类型四、空类型五、列表类型六、元组类型七、字典类型一、数字类型 1、整型int 就是整数：100 ，200，2，3，4······· 2、浮点...

99+

2022-11-12
java基础之数组常用操作总结(必看篇)

常用的对数组进行的操作1、求数组中最大值，最小值思路：假设下标为0的元素是最大值，遍历数组，依次跟max进行比较，如果有元素比这个max还大，则把这个值赋给max。最小值同样public class TestArray{ public s...

99+

2023-05-31

java 数组常用操作
Python教程之Pandas知识点汇总——查询，索引，基本统计

Python教程之Pandas知识点汇总——查询，索引，基本统计一. 查询与索引Series和一维数组的不同：在一维数组中就无法通过索引标签(index)获取数据，index默认是从0开始，步长为1的索引，也可以自己设置索引标签。若有两个序...

99+

2023-06-02
Python基础之函数嵌套知识总结

内部/内嵌函数 1、定义：在一个函数的函数体内使用关键字def关键字定义一个新的函数，这个新的函数就叫做内部/内嵌函数。 2、注意点：内部函数的整个函数体都在外部函数的作用域内，如...

99+

2022-11-12
Python基础之sorted（）函数用法

本篇是关于sorted()函数的一些基本用法，如有不足缺陷欢迎补充指正。 1、简单的排序 sorted函数可以对可迭代类型的容器内的数据进行排序 lst1 = (5,4,3,2,1)lst2 = ('...

99+

2023-10-12

python
python基础学习之递归函数知识总结

目录一、递归函数使用注意点二、递归的效率问题三、递归函数引入四、递归的深度五、通过缓存解决递归限制六、递归函数使用示例一、递归函数使用注意点递归函数一定要编写终止条件，否则将产生无...

99+

2022-11-12
python基础之引用和匿名函数

a=1 #1 为对象， def func(x): print('x的地址{}'.format(id(x))) x=2 print('x的地址{}'...

99+

2022-11-12
浏览器常用基本操作之python3+selenium4自动化测试(基础篇3)

1、打开指定的网页地址我们使用selenium进行自动化测试时，打开浏览器之后，第一步就是让浏览器访问我们指定的地址，可使用get方法实现 from selenium import webdriver driv...

99+

2022-06-02

python3 selenium4自动化测试 python selenium自动化测试
python基础之函数的定义和调用

# 第一题 # 写函数，接受n个数字，求这些参数数字的和 def sumFunc(*args): # 处理接受的数据 result=0 for item...

99+

2022-11-12
python基础学习之递归函数怎么用

小编给大家分享一下python基础学习之递归函数怎么用，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！一、递归函数使用注意点递归函数一定要编写终止条件，否则将产生无...

99+

2023-06-15
Python Pandas中loc和iloc函数的基本用法示例

目录1 loc和iloc的含义2 用法2.1 loc函数的用法2.2 iloc函数的用法补充：Pandas中loc和iloc函数实例总结1 loc和iloc的含义 loc表示loca...

99+

2022-11-11
python基础语法之函数应用实例分析

这篇“python基础语法之函数应用实例分析”文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希望大家阅读完这篇文章能有所收获，下面我们一起来看看这篇“python基础语法之函数应用实例...

99+

2023-06-30
Python最常用的函数、基础语句有哪些？

一、内置函数内置函数是python自带的函数方法，拿来就可以用，比方说zip、filter、isinstance等。下面是Python官档给出的内置函数列表，相当的齐全。下面几个是常见的内置函数：1、enumerate(iter...

99+

2023-05-14

Python 编程语言
100天精通Python（数据分析篇）——第66天：Pandas透视表基础+实战案例（pivot_table函数）

文章目录一、透视表基础参数说明+实战案例 0. 导入Excel数据 1. data 2. index 3. values 4. columns ...

99+

2023-09-07

python pandas 数据分析
MySQL基础篇(03)：系统和自定义函数总结，触发器使用详

本文源码：GitHub·点这里 || GitEE·点这里一、系统封装函数 MySQL 有很多内置的函数，可以快速解决开发中的一些业务需求，大概包括流程控制函数，数值型函数、字符串型函数、日期时间函数...

99+

2022-10-18
Python数据处理之pd.Series()函数的基本使用

目录1.Series介绍2.Series创建1.pd.Series([list],index=[list])2.pd.Series(np.arange())3 Series基本属性4...

99+

2022-11-11
Python基础学习之函数和代码复用详解

目录Python函数和代码复用一、函数的定义二、函数的调用三、函数的参数传递1.形式参数与实际参数2.位置传参与关键字传参3.可变对象与不可变对象的参数传递4.个数可变的位置、关键字...

99+

2022-11-11
python基础之reverse和reversed函数的介绍及使用

目录一、reverse二、reversed附：Python中reverse和reversed反转列表的操作方法总结一、reverse reverse()是python中列表...

99+

2022-12-23

python的reversed函数 python中的reversed和reverse python中的reverse函数