广告
返回顶部
首页 > 资讯 > 精选 >pandas数据清洗如何实现删除
  • 548
分享到

pandas数据清洗如何实现删除

2023-07-02 10:07:47 548人浏览 薄情痞子
摘要

这篇文章主要介绍“pandas数据清洗如何实现删除”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“pandas数据清洗如何实现删除”文章能帮助大家解决问题。准备工作(导入库、导入数据)import&n

这篇文章主要介绍“pandas数据清洗如何实现删除”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“pandas数据清洗如何实现删除”文章能帮助大家解决问题。

准备工作(导入库、导入数据)

import pandas as pdimport matplotlib.pyplot as pltimport numpy as npimport seaborn as  snssns.set_style("darkgrid")
list_csv = ['Amazon_top_selling_book.csv','breast_cancer_wisconsin.csv','diamonds.csv','insurance.csv','netflix_titles.csv','penguins.csv',           'titanic.csv','winequality-red.csv']dic_path = r'C:\Users\pandas\Desktop\task\228datasets\datasets'part_data = pd.read_csv(dic_path+'\\'+list_csv[4])part_data
 show_idtypetitledirectorcastcountrydate_addedrelease_yearratingdurationlisted_indescription
0s1MovieDick Johnson Is DeadKirsten JohnsonNaNUnited StatesSeptember 25, 20212020PG-1390 minDocumentariesAs her father nears the end of his life, filmm...
1s2TV ShowBlood & WaterNaNAma Qamata,
Khosi Ngema,
Gail Mabalane,
Thaban...
South AfricaSeptember 24, 20212021TV-MA2 SeasonsInternational TV Shows,
TV Dramas,
TV Mysteries
After crossing paths at a party, a Cape Town t...
2s3TV ShowGanglandsJulien LeclercqSami Bouajila,
Tracy Gotoas,
Samuel Jouy,
Nabi...
NaNSeptember 24, 20212021TV-MA1 SeasonCrime TV Shows,
International TV Shows,
TV Act...
To protect his family from a powerful drug lor...
3s4TV ShowJailbirds New OrleansNaNNaNNaNSeptember 24, 20212021TV-MA1 SeasonDocuseries, Reality TVFeuds, flirtations and toilet talk go down amo...
4s5TV ShowKota FactoryNaNMayur More,
Jitendra Kumar,
Ranjan Raj,
Alam K...
IndiaSeptember 24, 20212021TV-MA2 SeasonsInternational TV Shows,
Romantic TV Shows,
TV ...
In a city of coaching centers known to train I...
.......................................

8807 rows × 12 columns

检测数据情况

Hint:该函数用于检测任意DataFrame中缺失值情况

def missing_values_table(df):        mis_val = df.isnull().sum()        mis_val_percent = 100 * df.isnull().sum() / len(df)        mis_val_table = pd.concat([mis_val, mis_val_percent], axis=1)        mis_val_table_ren_columns = mis_val_table.rename(        columns = {0 : 'Missing Values', 1 : '% of Total Values'})        mis_val_table_ren_columns = mis_val_table_ren_columns[            mis_val_table_ren_columns.iloc[:,1] != 0].sort_values(        '% of Total Values', ascending=False).round(1)        print ("Your selected dataframe has " + str(df.shape[1]) + " columns.\n"                  "There are " + str(mis_val_table_ren_columns.shape[0]) +              " columns that have missing values.")        return mis_val_table_ren_columns
missing_values_table(part_data)

Your selected dataframe has 12 columns.
There are 6 columns that have missing values.

 Missing Values% of Total Values
director263429.9
country8319.4
cast8259.4
date_added100.1
rating40.0
duration30.0

DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False)

参数说明:

  • labels 就是要删除的行列的名字,用列表给定

  • axis 默认为0,指删除行,因此删除columns时要指定axis=1;

  • index 直接指定要删除的行

  • columns 直接指定要删除的列

  • inplace=False,默认该删除操作不改变原数据,而是返回一个执行删除操作后的新dataframe;

  • inplace=True,则会直接在原数据上进行删除操作,删除后无法返回。

方式一:删除指定行或列

labels+axis

demo = part_data.drop(['director'], axis=1)missing_values_table(demo)

Your selected dataframe has 11 columns.
There are 5 columns that have missing values.

 Missing Values% of Total Values
country8319.4
cast8259.4
date_added100.1
rating40.0
duration30.0
方式二:利用boolean删除满足条件元素所在的行

df = df.drop(df[].index)

# 删除release_year年份在2009年之前的行demo = part_data.drop(part_data[part_data["release_year"]<2009].index)demo.shape

(7624, 12)

关于“pandas数据清洗如何实现删除”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网精选频道,小编每天都会为大家更新不同的知识点。

--结束END--

本文标题: pandas数据清洗如何实现删除

本文链接: https://www.lsjlt.com/news/341254.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • pandas数据清洗如何实现删除
    这篇文章主要介绍“pandas数据清洗如何实现删除”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“pandas数据清洗如何实现删除”文章能帮助大家解决问题。准备工作(导入库、导入数据)import&n...
    99+
    2023-07-02
  • pandas数据清洗实现删除的项目实践
    目录准备工作(导入库、导入数据)检测数据情况DataFrame.drop(labels=None,axis=0, index=None, columns=None, inp...
    99+
    2022-11-11
  • pandas实现数据清洗有哪些方法
    pandas实现数据清洗的方法有:1、缺失值处理;2、重复值处理;3、数据类型转换;4、异常值处理;5、数据规范化;6、数据筛选;7、数据聚合和分组;8、数据透视表等。详细介绍:1、缺失值处理,Pandas提供了多种处理缺失值的方法,对于缺...
    99+
    2023-11-22
    数据清洗 Pandas
  • Python如何实现数据清洗
    小编给大家分享一下Python如何实现数据清洗,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!数据清洗小工具箱在下面的代码片段中,数据清洗代码被封装在了一些函数中,代码的目的十分直观。你可以直接使用这些代码,无需将它们嵌入到...
    99+
    2023-06-28
  • pandas实现数据读取&清洗&分析的项目实践
    目录一、数据读取和写入1.1 CSV和txt文件:1.2 Excel文件:1.3 MYSQL数据库:二、数据清洗2.1 清除不需要的行数据2.2 清除不需要的列2.3 调整列的展示顺...
    99+
    2022-11-11
  • pandas数据处理清洗实现中文地址拆分案例
    目录一、案例场景二、初步方案三、优化方案一、案例场景 字段login_place,一共267725行记录,随机15条记录如下:   后续数据分析工作需要用...
    99+
    2022-11-12
  • Python怎么实现数据清洗
    本文小编为大家详细介绍“Python怎么实现数据清洗”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python怎么实现数据清洗”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。这里数据清洗需要用到的库是pandas...
    99+
    2023-07-06
  • python如何清洗数据
    在Python中,可以使用各种库和工具来清洗数据。下面是一些常用的方法:1. 数据去重:使用pandas库的`drop_d...
    99+
    2023-09-12
    python
  • 详解Python如何利用Pandas与NumPy进行数据清洗
    目录准备工作DataFrame 列的删除DataFrame 索引更改DataFrame 数据字段整理str 方法与 NumPy 结合清理列apply 函数清理整个数据集DataFra...
    99+
    2022-11-10
  • Python 数据清洗删除缺失值替换缺失值详情
    目录一、缺失数据剔除1. python 方式2. DataFrame 方式二、缺失值补全三、重复值剔除(按照行和列)四、数值转换1. replace2. apply3.applyma...
    99+
    2022-11-11
  • Python如何实现Excel数据的探索和清洗
    这篇文章主要介绍了Python如何实现Excel数据的探索和清洗,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。python是什么意思Python是一种跨平台的、具有解释性、编...
    99+
    2023-06-14
  • Pandas DataFrame.drop()删除数据的方法实例
    目录语法参数结果展示扩展总结df.drop()通过指定标签名称和相应的轴,或直接给定索引或列名称来删除行或列 语法 df.drop(labels = None, axis = 0, ...
    99+
    2022-11-11
  • Python实现数据清洗的示例详解
    目录前言去掉信息不全的用户描述答案修补缺失的用户数据描述答案解决牛客网用户重复的数据描述答案统一最后刷题日期的格式描述答案将用户的json文件转换为表格形式描述答案前言 Python...
    99+
    2022-11-11
  • GO 语言如何实现大数据处理中的数据清洗?
    随着大数据时代的到来,数据的清洗和处理变得越来越重要。数据清洗可以帮助我们剔除掉一些无用的数据,同时也能够提高我们后续处理数据的效率。在数据清洗的过程中,我们往往需要处理大量的数据,因此我们需要一种高效的语言来完成数据清洗的任务。而 GO...
    99+
    2023-09-17
    大数据 接口 关键字
  • 如何用Python进行数据清洗
    这篇文章主要介绍“如何用Python进行数据清洗”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“如何用Python进行数据清洗”文章能帮助大家解决问题。 数据清洗是...
    99+
    2022-10-19
  • pandas删除部分数据后重新生成索引如何实现
    这篇文章主要介绍“pandas删除部分数据后重新生成索引如何实现”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“pandas删除部分数据后重新生成索引如何实现”文章能帮助大家解决问题。pandas删除...
    99+
    2023-07-02
  • pandas删除某行或某列数据的实现示例
    目录1、drop()函数2、del函数首先,创建一个DataFrame格式数据作为举例数据。 # 创建一个DataFrame格式数据 data = {'a': ['a0', 'a1'...
    99+
    2022-11-11
  • python操作excel实现数据清洗的示例
    本文将为大家详细介绍“python操作excel实现数据清洗的示例”,内容步骤清晰详细,细节处理妥当,而小编每天都会更新不同的知识点,希望这篇“python操作excel实现数据清洗的示例”能够给你意想不到的收获,请大家跟着小编的思路慢慢深...
    99+
    2023-06-06
  • php如何实现删除数据
    这篇文章主要介绍了php如何实现删除数据,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。php实现删除数据的方法:1、创建一个PHP示例文件;2、连接数据库;3、通过“dele...
    99+
    2023-06-25
  • Python pandas找出、删除重复的数据实例
    目录前言一、duplicated()二、drop_duplicates()总结前言 当我们使用pandas处理数据的时候,经常会遇到数据重复的问题,如何找出重复数据进而分析重复原因,...
    99+
    2022-11-11
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作