广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python中常用探索性数据分析方法有哪些
  • 375
分享到

Python中常用探索性数据分析方法有哪些

2023-06-25 16:06:39 375人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍了python中常用探索性数据分析方法有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。常用探索性数据分析方法很多,比如常用的 pandas DataFra

这篇文章主要介绍了python中常用探索性数据分析方法有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

常用探索性数据分析方法很多,比如常用的 pandas DataFrame 方法有 .head()、.tail()、.info()、.describe()、.plot() 和 .value_counts()。

import pandas as pdimport numpy as npdf = pd.DataFrame( {     "Student" : ["Mike", "Jack", "Diana", "Charles", "Philipp", "Charles", "Kale", "Jack"] ,           "City" : ["London", "London", "Berlin", "London", "London", "Berlin", "London", "Berlin"] ,"Age" : [20, 40, 18, 24, 37, 40, 44, 20 ],"Maths_Score" : [84, 80, 50, 36, 44, 24, 41, 35],"Science_Score" : [66, 83, 51, 35, 43, 58, 71, 65]} ) df

在 Pandas 中创建 groupby() 对象

在许多情况下,我们希望将数据集拆分为多个组并对这些组进行处理。 Pandas 方法 groupby() 用于将 DataFrame 中的数据分组。

与其一起使用 groupby() 和聚合方法,不如创建一个 groupby() 对象。 理想的情况是,我们可以在需要时直接使用此对象。

让我们根据列“City”将给定的 DataFrame 分组

df_city_group = df.groupby("City")

我们创建一个对象 df_city_group,该对象可以与不同的聚合相结合,例如 min()、max()、mean()、describe() 和 count()。 一个例子如下所示。

Python中常用探索性数据分析方法有哪些


要获取“City”是Berlin的 DataFrame 子集,只需使用方法 .get_group()

Python中常用探索性数据分析方法有哪些


这不需要为每个组创建每个子 DataFrame 的副本,比较节省内存。

另外,使用 .groupby() 进行切片比常规方法快 2 倍!!

Python中常用探索性数据分析方法有哪些

使用 .nlargest()

通常,我们根据特定列的值了解 DataFrame 的 Top 3 或 Top 5 数据。例如,从考试中获得前 3 名得分者或从数据集中获得前 5 名观看次数最多的电影。使用 Pandas .nlargest() 是最简单的方式。

df.nlargest(N, column_name, keep = ‘first' )

使用 .nlargest() 方法,可以检索包含指定列的 Top ‘N' 值的 DataFrame 行。

在上面的示例中,让我们获取前 3 个“Maths_Score”的 DataFrame 的行。

Python中常用探索性数据分析方法有哪些

如果两个值之间存在联系,则可以修改附加参数和可选参数。 它需要值“first”、“last”和“all”来检索领带中的第一个、最后一个和所有值。这种方法的优点是,你不需要专门对 DataFrame 进行排序

使用 .nsmallest()

与Top 3 或5 类似,有时我们也需要DataFrame 中的Last 5 条记录。例如,获得评分最低的 5 部电影或考试中得分最低的 5 名学生。使用 Pandas .nsmallest() 是最简单的方式

df.nsmallestst(N, column_name, keep = ‘first' )

使用 .nsmallest() 方法,可以检索包含指定列的底部“N”个值的 DataFrame 行。

在同一个示例中,让我们获取 DataFrame“df”中“Maths_Score”最低的 3 行。

Python中常用探索性数据分析方法有哪些

逻辑比较

比较运算符 <、>、<=、>=、==、!= 及其包装器 .lt()、.gt()、.le()、.ge()、.eq() 和 .ne() 分别在以下情况下非常方便将 DataFrame 与基值进行比较,这种比较会产生一系列布尔值,这些值可用作以后的指标。

  • 基于比较对 DataFrame 进行切片

  • 可以基于与值的比较从 DataFrame 中提取子集。

  • 根据两列的比较在现有 DataFrame 中创建一个新列。

所有这些场景都在下面的示例中进行了解释

# 1. Comparing the DataFrame to a base value# Selecting the columns with numerical values onlydf.iloc[:,2:5].gt(50)df.iloc[:,2:5].lt(50)# 2. Slicing the DataFrame based on comparison# df1 is subset of df when values in "Maths_Score" column are not equal or equal to '35'df1 = df[df["Maths_Score"].ne(35)]df2 = df[df["Maths_Score"].eq(35)]# 3. Creating new column of True-False values by comparing two columnsdf["Maths_Student"] = df["Maths_Score"].ge(df["Science_Score"])df["Maths_Student_1"] = df["Science_Score"].le(df["Maths_Score"])

感谢你能够认真阅读完这篇文章,希望小编分享的“Python中常用探索性数据分析方法有哪些”这篇文章对大家有帮助,同时也希望大家多多支持编程网,关注编程网Python频道,更多相关知识等着你来学习!

--结束END--

本文标题: Python中常用探索性数据分析方法有哪些

本文链接: https://www.lsjlt.com/news/305701.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python中常用探索性数据分析方法有哪些
    这篇文章主要介绍了Python中常用探索性数据分析方法有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。常用探索性数据分析方法很多,比如常用的 Pandas DataFra...
    99+
    2023-06-25
  • Python 更快进行探索性数据分析的四个方法
    大家好,常用探索性数据分析方法很多,比如常用的 Pandas DataFrame 方法有 .head()、.tail()、.info()、.describe()、.plot() 和 ...
    99+
    2022-11-12
  • Python中Sweetviz如何实现探索性数据分析
    小编给大家分享一下Python中Sweetviz如何实现探索性数据分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!Sweetviz 是一个开源 Python 库,它只需三行代码就可以生成漂亮的高精度可视化效果来启动EDA...
    99+
    2023-06-25
  • 电商数据分析的常用方法有哪些
    电商数据分析的常用方法有市场分析、用户行为分析、商品分析、营销策略分析、供应链分析、用户满意度分析和大数据分析等。详细介绍:1、市场分析方法,通过分析市场数据,企业可以了解目标市场的规模、增长趋势,以及竞争对手的策略;2、用户行为分析方法,...
    99+
    2023-08-10
  • 数据分析方法有哪些
    数据分析方法有:1、描述性统计分析,对数据集的基本统计项进行计算和总结,来描述数据的特征和分布;2、探索性数据分析,对数据集进行初步探索,以发现数据中潜藏的模式,异常和趋势等信息;3、假设检验,使用统计方法来评估某个假设是否成立;4、回归分...
    99+
    2023-08-07
  • Python数据分析常用工具有哪些
    Python数据分析常用工具有以下几种:1. NumPy:用于高性能数值计算和数组操作的库。2. Pandas:用于数据分析和数据处...
    99+
    2023-10-12
    Python
  • 搜索引擎优化SEO常用分析方法有哪些
    这篇文章将为大家详细讲解有关搜索引擎优化SEO常用分析方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。如何分析竞争对手网站外部因素分析:雅虎查反向链接数量。百度谷歌查询收录量。查询域名使用时间.内...
    99+
    2023-06-10
  • pandas数据分析有哪些方法
    pandas数据分析的方法有:1、数据读取与处理;2、数据筛选与选择;3、数据排序与整理;4、数据聚合与分组;5、数据透视与透视表;6、合并与连接数据;7、数据持久化与保存。Pandas库提供了丰富的数据分析和处理功能,涵盖了数据的读取、处...
    99+
    2023-11-22
    Pandas
  • spss数据分析方法有哪些
    这篇文章主要讲解了“spss数据分析方法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“spss数据分析方法有哪些”吧!spss数据分析的五种方法:1、线性模型;点击分析,一般线性模型,...
    99+
    2023-06-20
  • Python常见的数据分析库有哪些
    这篇文章主要介绍“Python常见的数据分析库有哪些”,在日常操作中,相信很多人在Python常见的数据分析库有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python常见的数据分析库有哪些”的疑惑有所...
    99+
    2023-06-02
  • 大数据分析中,Python的常用关键字有哪些?
    大数据分析是当今互联网时代中极为重要的领域,而Python作为一种高效、易学易用的编程语言,也成为了数据分析领域中的热门工具之一。在Python的使用过程中,有一些常用的关键字,下面我们来详细介绍一下。 import 在Python中,...
    99+
    2023-11-06
    leetcode 大数据 关键字
  • 探索Golang中常用的数据类型转换方法
    探索Golang中常用的数据类型转换方法前言在Golang编程中,经常会遇到不同数据类型之间的转换问题。本文将介绍一些常用的数据类型转换方法,并附上具体的代码示例,以供大家参考。字符串与整数之间的转换在Golang中,字符串与整数之间的转换...
    99+
    2023-12-23
    数据类型 Golang 转换方法
  • pandas数据分析常用函数有哪些
    小编给大家分享一下pandas数据分析常用函数有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧! 导入模块import pandas as pd   ...
    99+
    2023-06-01
  • 大数据处理中,Python有哪些常见的数据分析库?
    在当今信息化时代,大数据处理已经成为了各行各业必不可少的工作。而在大数据处理的过程中,数据分析是至关重要的一步。为了更加高效地完成数据分析工作,很多人都会使用Python编程语言进行数据处理。而Python作为一种非常流行的编程语言,其拥有...
    99+
    2023-11-06
    leetcode 大数据 关键字
  • Python数据分析Numpy中常用相关性函数
    目录摘要:一、股票相关性分析二、多项式三、求极值的知识摘要: NumPy中包含大量的函数,这些函数的设计初衷是能更方便地使用,掌握解这些函数,可以提升自己的工作效率。这些函数包括数组...
    99+
    2022-11-11
  • Python中有哪些字典常用方法
    Python中有哪些字典常用方法?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1、clear方法清除字典中所有的项,这是一个原地操作,所以无返回值(或则说返回None)d&...
    99+
    2023-06-15
  • 数据挖掘常用的方法有哪些
    这篇文章将为大家详细讲解有关数据挖掘常用的方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。   ① 分类。分类是找出数据库中一组数据对象的共同...
    99+
    2022-10-19
  • Python在大数据分析中有哪些实用的库?
    随着数据量的不断增长,数据分析变得越来越复杂,需要使用更高效和更强大的工具来处理数据。Python作为一种高级编程语言,具有丰富的库和工具,可以大大简化数据分析的过程。在本文中,我们将介绍Python中一些在大数据分析中非常实用的库。 ...
    99+
    2023-08-18
    git django 大数据
  • 用Python做数据分析的优点有哪些
    这篇文章主要讲解了“用Python做数据分析的优点有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“用Python做数据分析的优点有哪些”吧!Python优点一:“流程可控,工作高效”举个...
    99+
    2023-06-02
  • JavaScript中有哪些常用的属性方法
    JavaScript中有哪些常用的属性方法?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。JavaScript常用属性方法有:document.write(&qu...
    99+
    2023-06-14
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作