返回顶部
首页 > 资讯 > 后端开发 > Python >Python3 DataFrame缺失值的处理方法
  • 653
分享到

Python3 DataFrame缺失值的处理方法

2024-04-02 19:04:59 653人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

目录一、缺失值的判断二、缺失值数据的过滤三、缺失值数据的填充四、缺失值的删除一、缺失值的判断 在通过pandas做数据分析时,数据中往往会因为一些原因而出现缺失值NaN (Nota

一、缺失值的判断

在通过pandas数据分析时,数据中往往会因为一些原因而出现缺失值NaN (Nota number)o比如前文中的例子,当两个DataFrame对象进行简单运算时,无法匹配的位置会出现缺失值NaN或者None.

isnull ( )和notnull ( )方法都可以用于判断数据是否为缺失值( NaN或者None).如果是缺失值,则isnull()返回值为True, notnull()返回值为False.

df2
Out[170]: 
      A     B     C   D
a   2.0   4.0   6.0 NaN
b   6.0   8.0  10.0 NaN
c  10.0  12.0  14.0 NaN
 
df2.isnull()
Out[171]: 
       A      B      C     D
a  False  False  False  True
b  False  False  False  True
c  False  False  False  True
 
df2.notnull()
Out[172]: 
      A     B     C      D
a  True  True  True  False
b  True  True  True  False
c  True  True  True  False

二、缺失值数据的过滤

有时遇到包含缺失值的数据处理起来比较简单,只需要保留有数值的数据即可:

df2
Out[182]: 
      A     B     C    D
a   2.0   4.0   6.0  NaN
b   6.0   8.0  10.0  NaN
c  10.0  12.0  14.0  1.0
 
#把D列中的缺失值过滤掉
df2.D[df2.D.notnull()]
Out[183]: 
c    1.0
Name: D, dtype: float64

三、缺失值数据的填充

有时处理数据时我们会想将缺失值用实际的值做替代,Pandas包里也有函数可以调 用:DataFrame.fillna(value=None, method = None, axis = None, inplace=False, limit=None)

参数value是在缺失值处填充的值,可以是数值数字,也可以是字符串method 是填充的方式,默认为None,也可以取值为ffin、pad、bfill或backfill,其中ffill/pad是用行或列方向上的上一个观测值来填充缺失值,bfill/backfin是用行或列方向上的下一个观测 值来填充;axis与method配合使用,指定行(axis=l)或列(axis=0)的方向;limit=None 时,会填充连续的缺失值,如果指定数值的话,比如limit=2,只会依次填充连续NaN值的 指定数字个数(比如2个);若inplace=False则不会变更原DataFrame,若inplace=True, 则会改变原DataFrame。

import pandas as pd
import numpy as np
h2h2df=pd.DataFrame(np.arange(1,21).reshape(5,4),index=list('abcde'),columns=list("ABCD"))
h2df.loc['c','A']=np.nan
h2df.loc['b':'d','C']=np.nan
h2df
Out[192]: 
      A   B     C   D
a   1.0   2   3.0   4
b   5.0   6   NaN   8
c   NaN  10   NaN  12
d  13.0  14   NaN  16
e  17.0  18  19.0  20
h2df.fillna(0)
Out[193]: 
      A   B     C   D
a   1.0   2   3.0   4
b   5.0   6   0.0   8
c   0.0  10   0.0  12
d  13.0  14   0.0  16
e  17.0  18  19.0  20
h2df.fillna(method='ffill')
Out[194]: 
      A   B     C   D
a   1.0   2   3.0   4
b   5.0   6   3.0   8
c   5.0  10   3.0  12
d  13.0  14   3.0  16
e  17.0  18  19.0  20
h2df.fillna(method='pad')
Out[197]: 
      A   B     C   D
a   1.0   2   3.0   4
b   5.0   6   3.0   8
c   5.0  10   3.0  12
d  13.0  14   3.0  16
e  17.0  18  19.0  20
h2df.fillna(method='backfill',axis=1)
Out[196]: 
      A     B     C     D
a   1.0   2.0   3.0   4.0
b   5.0   6.0   8.0   8.0
c  10.0  10.0  12.0  12.0
d  13.0  14.0  16.0  16.0
e  17.0  18.0  19.0  20.0
h2df.fillna(method='ffill',limit=2)
Out[198]: 
      A   B     C   D
a   1.0   2   3.0   4
b   5.0   6   3.0   8
c   5.0  10   3.0  12
d  13.0  14   NaN  16
e  17.0  18  19.0  20

四、缺失值的删除

Pandas提供对包含缺失值的数据集进行行列的删除操作:

DataFrame.dropna(axis=0, how=‘any’, thresh=None) 

axis = 0指删除包含缺失值的行,axis = 1指删除包含缺失值的列,默认为0; how=any表示只要有一个缺失值就删除该行(列),how = all表示只有当所有的元素都为缺失值时才删除该行(列),how默认取值为any;thresh默认为None。当thresh=5时表示只有当某行(列)缺失值的数量大于或者等于5时删除该 行(列)。

df
Out[199]: 
      A   B     C   D
a   1.0   2   3.0   4
b   5.0   6   NaN   8
c   NaN  10   NaN  12
d  13.0  14   NaN  16
e  17.0  18  19.0  20
 
df.dropna(axis=0)
Out[200]: 
      A   B     C   D
a   1.0   2   3.0   4
e  17.0  18  19.0  20
 
df.dropna(axis=1)
Out[201]: 
    B   D
a   2   4
b   6   8
c  10  12
d  14  16
e  18  20

到此这篇关于python3 DataFrame缺失值的处理的文章就介绍到这了,更多相关python3 DataFrame缺失值内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python3 DataFrame缺失值的处理方法

本文链接: https://www.lsjlt.com/news/117940.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python3 DataFrame缺失值的处理方法
    目录一、缺失值的判断二、缺失值数据的过滤三、缺失值数据的填充四、缺失值的删除一、缺失值的判断 在通过Pandas做数据分析时,数据中往往会因为一些原因而出现缺失值NaN (Nota ...
    99+
    2024-04-02
  • Python缺失值处理方法
    前言: 前面python重复值处理得方法我们讲了重复值是怎么处理的,今天就来说说缺失值。缺失值主要分为机械原因和人为原因。机械原因就是存储器坏了,机器故障等等原因导致某段时间未能收集...
    99+
    2024-04-02
  • pandas中NaN缺失值的处理方法
    本文主要介绍了pandas中NaN缺失值的处理方法,主要有两种方法,具体如下: import pandas as pd 缺失值处理 两种方法: 删除含有缺失值的样本 替换/插补 处理缺失...
    99+
    2022-06-02
    pandas NaN缺失值 python 缺失值
  • Python处理缺失值的8种不同方法实例
    目录前言1. 删除有缺失值的行或列2. 删除只有缺失值的行或列3. 根据阈值删除行或列4. 基于特定的列子集删除5. 填充一个常数值6. 填充聚合值7. 替换为上一个或下一个值8. ...
    99+
    2024-04-02
  • Python pandas处理缺失值方法详解(dropna、drop、fillna)
    目录面对缺失值三种处理方法:对于option1:对于option 2:对于option3总结面对缺失值三种处理方法: option 1: 去掉含有缺失值的样本(行)option 2:...
    99+
    2024-04-02
  • Python缺失值如何处理
    这篇文章主要介绍了Python缺失值如何处理的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python缺失值如何处理文章都会有所收获,下面我们一起来看看吧。先构建一个含有缺失值的DataFrame,如下:imp...
    99+
    2023-06-30
  • Python中缺失值怎么处理
    这篇文章主要介绍“Python中缺失值怎么处理”,在日常操作中,相信很多人在Python中缺失值怎么处理问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python中缺失值怎么处理”的疑惑有所帮助!接下来,请跟...
    99+
    2023-06-21
  • Keras中如何处理缺失值
    在Keras中处理缺失值的方法取决于数据集的特点以及建模的方式。以下列举了一些处理缺失值的常见方法: 将缺失值替换为固定值:可以将...
    99+
    2024-03-14
    Keras
  • Python数据分析的八种处理缺失值方法详解
    目录1. 删除有缺失值的行或列2. 删除只有缺失值的行或列3. 根据阈值删除行或列4. 基于特定的列子集删除5. 填充一个常数值6. 填充聚合值7. 替换为上一个或下一个值8. 使用...
    99+
    2024-04-02
  • Python数据预处理时缺失值的不同处理方式总结
    目录1. 固定值填充2. 均值填充3. 中位数填充4. 插补法填充在使用python做数据分析的时候,经常需要先对数据做统一化的处理,缺失值的...
    99+
    2022-12-22
    Python数据预处理 缺失值 Python数据预处理 Python 预处理
  • python缺失值的解决方法总结
    1、解决方法 (1)忽视元组。 缺少类别标签时,通常这样做(假设挖掘任务与分类有关),除非元组有多个属性缺失值,否则该方法不太有效。当个属性缺值的百分比变化很大时,其性能特别差。 (2)人工填写缺失值。 一般来说,这...
    99+
    2022-06-02
    python 缺失值
  • pandas数据清洗(缺失值和重复值的处理)
    目录前言缺失值处理缺失值的判断缺失值统计缺失值筛选缺失值类型 插入缺失值缺失值填充插值填充interpolate() 的具体参数 缺失值删除 缺失值删除...
    99+
    2024-04-02
  • slearn缺失值处理器之Imputer详析
    目录参数:注意:所以在处理的时候注意,要进行适当处理补充:sklearn中的Imputer模块改动总结class sklearn.preprocessing.Imputer(miss...
    99+
    2024-04-02
  • PaddlePaddle框架怎么处理缺失值和异常值
    在PaddlePaddle框架中,处理缺失值和异常值的方法通常包括以下几种: 缺失值处理:通常可以使用均值、中位数、众数等方式填...
    99+
    2024-03-07
    PaddlePaddle
  • python用dataframe将csv中的0值数据转化为nan缺失值字样
    用到这个语句。 c[c==0]=np.nan 我们具体来看一下c和np是什么 np就是我引入的pandas库, c呢是我读入csv文件的其中一列,列名为“上行业务量GB” df是整个csv文件的数据,他的类型...
    99+
    2022-06-02
    python csv的0值转化为nan缺失值 python 转化为nan缺失值
  • Pandas如何处理DataFrame中的inf值
    目录如何处理DataFrame的inf值DataFrame有关inf的处理技巧什么是inf?为什么会产生?产生inf有什么好处?产生inf有什么坏处?怎么处理?怎么获取到inf的所在...
    99+
    2024-04-02
  • spss缺失值填补方法有几种
    这篇文章主要介绍了spss缺失值填补方法有几种,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。spss缺失值填补方法有:1、均值插补,用该属性的众数来补齐缺失的值;2、利用同类...
    99+
    2023-06-15
  • Python查询缺失值的4种方法总结
    目录缺失值 NaN ①缺失值 NaN ②空值字符“-”、“?”等在我们日常接触到的Python中,狭义的缺失值一般指DataFrame...
    99+
    2024-04-02
  • 使用R语言填补缺失值的方法
    使用R语言填补缺失值 数据处理过程中,往往会存在缺失值,对于缺失值的处理,目前各大统计书提出的方法有剔除,用均数填补,用众数填补,采用其他自变量进行回归,推算缺失值进行填补等。在R语...
    99+
    2024-04-02
  • Python Pandas知识点之缺失值处理详解
    前言 数据处理过程中,经常会遇到数据有缺失值的情况,本文介绍如何用Pandas处理数据中的缺失值。 一、什么是缺失值 对数据而言,缺失值分为两种,一种是Pandas中的空值,另一种是...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作