iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python数据可视化探索实例分享
  • 268
分享到

Python数据可视化探索实例分享

2024-04-02 19:04:59 268人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

目录一、数据可视化与探索图二、常见的图表实例1.折线图2.散布图3.直方图、长条图4. 圆饼图、箱形图三、社区调查四、波士顿房屋数据集一、数据可视化与探索图 数据可视化是指用图形或表

一、数据可视化与探索图

数据可视化是指用图形或表格的方式来呈现数据。图表能够清楚地呈现数据性质, 以及数据间或属性间的关系,可以轻易地让人看图释义。用户通过探索图(Exploratory Graph)可以了解数据的特性、寻找数据的趋势、降低数据的理解门槛。

二、常见的图表实例

本章主要采用 pandas 的方式来画图,而不是使用 Matplotlib 模块。其实 Pandas 已经把 Matplotlib 的画图方法整合到 DataFrame 中,因此在实际应用中,用户不需要直接引用 Matplotlib 也可以完成画图的工作。

1.折线图

折线图(line chart)是最基本的图表,可以用来呈现不同栏位连续数据之间的关系。绘制折线图使用的是 plot.line() 的方法,可以设置颜色、形状等参数。在使用上,拆线图绘制方法完全继承了 Matplotlib 的用法,所以程序最后也必须调用 plt.show() 产生图,如图8.4 所示。

df_iris[['sepal length (cm)']].plot.line()
plt.show()
ax = df[['sepal length (cm)']].plot.line(color='green',title="Demo",style='--')
ax.set(xlabel="index", ylabel="length")
plt.show()

2.散布图

散布图(Scatter Chart)用于检视不同栏位离散数据之间的关系。绘制散布图使用的是 df.plot.scatter(),如图8.5所示。

df = df_iris
df.plot.scatter(x='sepal length (cm)', y='sepal width (cm)')
from matplotlib import cm
cmap = cm.get_cmap('Spectral')
df.plot.scatter(x='sepal length (cm)',
          y='sepal width (cm)',
          s=df[['petal length (cm)']]*20,
          c=df['target'],
          cmap=cmap,
          title='different circle size by petal length (cm)')

3.直方图、长条图

直方图(Histogram Chart)通常用于同一栏位,呈现连续数据的分布状况,与直方图类似的另一种图是长条图(Bar Chart),用于检视同一栏位,如图 8.6 所示。

df[['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)','petal width (cm)']].plot.hist()
2 df.target.value_counts().plot.bar()

4. 圆饼图、箱形图

圆饼图(Pie Chart)可以用于检视同一栏位各类别所占的比例,而箱形图(Box Chart)则用于检视同一栏位或比较不同栏位数据的分布差异,如图 8.7 所示。

df.target.value_counts().plot.pie(legend=True)
df.boxplot(column=['target'],figsize=(10,5))

数据探索实战分享:

本节利用两个真实的数据集实际展示数据探索的几种手法。

三、社区调查

在美国社区调查(American CommUnity Survey)中,每年约有 350 万个家庭被问到关于他们是谁及他们如何生活的详细问题。调查的内容涵盖了许多主题,包括祖先、教育、工作、交通、互联网使用和居住。

数据名称:2013 American Community Survey。

先观察数据的样子与特性,以及每个栏位代表的意义、种类和范围。

# 读取数据
df = pd.read_csv("./ss13husa.csv")
# 栏位种类数量
df.shape
# (756065,231)
# 栏位数值范围
df.describe()

先将两个 ss13pusa.csv 串连起来,这份数据总共包含 30 万笔数据,3 个栏位:SCHL ( 学历,School Level)、 PINCP ( 收入,Income) 和 ESR ( 工作状态,Work Status)。

pusa = pd.read_csv("ss13pusa.csv") pusb = pd.read_csv("ss13pusb.csv")
# 串接两份数据
col = ['SCHL','PINCP','ESR']
df['ac_survey'] = pd.concat([pusa[col],pusb[col],axis=0)

依据学历对数据进行分群,观察不同学历的数量比例,接着计算他们的平均收入。

group = df['ac_survey'].groupby(by=['SCHL']) print('学历分布:' + group.size())
group = ac_survey.groupby(by=['SCHL']) print('平均收入:' +group.mean())

四、波士顿房屋数据集

波士顿房屋数据集(Boston House Price Dataset)包含有关波士顿地区的房屋信息, 包 506 个数据样本和 13 个特征维度。

数据名称:Boston House Price Dataset。

先观察数据的样子与特性,以及每个栏位代表的意义、种类和范围。

可以用直方图的方式画出房价(MEDV)的分布,如图 8.8 所示。

df = pd.read_csv("./housing.data")
# 栏位种类数量
df.shape
# (506, 14)
#栏位数值范围df.describe()
import matplotlib.pyplot as plt
df[['MEDV']].plot.hist()
plt.show()

注:图中英文对应笔者在代码中或数据中指定的名字,实践中读者可将它们替换成自己需要的文字。

接下来需要知道的是哪些维度与“房价”关系明显。先用散布图的方式来观察,如图8.9所示。

# draw scatter chart
df.plot.scatter(x='MEDV', y='RM') .
plt.show()

最后,计算相关系数并用聚类热图(Heatmap)来进行视觉呈现,如图 8.10 所示。

# compute pearson correlation
corr = df.corr()
# draw  heatmap
import seaborn as sns
corr = df.corr()
sns.heatmap(corr)
plt.show()

颜色为红色,表示正向关系;颜色为蓝色,表示负向关系;颜色为白色,表示没有关系。RM 与房价关联度偏向红色,为正向关系;LSTAT、PTRATIO 与房价关联度偏向深蓝, 为负向关系;CRIM、RAD、AGE 与房价关联度偏向白色,为没有关系。

到此这篇关于python数据可视化探索实例分享的文章就介绍到这了,更多相关Python数据可视化内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python数据可视化探索实例分享

本文链接: https://www.lsjlt.com/news/118225.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python数据可视化探索实例分享
    目录一、数据可视化与探索图二、常见的图表实例1.折线图2.散布图3.直方图、长条图4. 圆饼图、箱形图三、社区调查四、波士顿房屋数据集一、数据可视化与探索图 数据可视化是指用图形或表...
    99+
    2024-04-02
  • Python 数据可视化神器分享:py
    Python 数据可视化神器分享:pyecharts Python 数据可视化神器分享:pyecharts 我们都知道python上的一款可视化工具matplotlib,而前些阵子做一个Spark项目的时候用到了百度开源的一个可视化JS工...
    99+
    2023-01-31
    神器 数据 Python
  • Python实现数据可视化案例分析
    目录1. 问题描述2. 实验环境3. 实验步骤及结果1. 问题描述 对右图进行修改: 请更换图形的风格请将 x 轴的数据改为-10 到 10请自行构造一个 y 值的函数将直方图上的数...
    99+
    2024-04-02
  • Python数据可视化举例分析
    这篇文章主要介绍“Python数据可视化举例分析”,在日常操作中,相信很多人在Python数据可视化举例分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python数据可视化举例分析”的疑惑有所帮助!接下来...
    99+
    2023-06-16
  • python数据分析绘图可视化实例分析
    本篇内容介绍了“python数据分析绘图可视化实例分析”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!前言:数据分析初始阶段,通常都要进行可视...
    99+
    2023-07-02
  • 如何在Python中进行数据可视化和探索
    如何在Python中进行数据可视化和探索数据可视化和探索是数据分析的重要环节之一,在Python中借助各种强大的库和工具,我们可以方便地进行数据可视化和探索。本文将介绍Python中常用的数据可视化库和技术,并给出具体的代码示例。引言数据可...
    99+
    2023-10-22
    Python 数据可视化 探索
  • Python 的可视化工具箱:探索数据的无限可能
    Python 作为一种功能强大的编程语言,为数据可视化提供了丰富的工具箱。这些工具使数据科学家和分析师能够将复杂的数据转换为直观易懂的可视化效果,从而揭示模式、趋势和见解。 1. Matplotlib:基础且灵活 Matplotlib 是...
    99+
    2024-03-07
    Python 可视化、数据可视化、Matplotlib、Seaborn、Pandas Profiling、Plotly、Bokeh
  • Python可视化动图分享
    这篇文章主要讲解了“Python可视化动图分享”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python可视化动图分享”吧!1. 柱状图带颜色渐变的柱状图,精美好看:2. 折线图带有标注点,...
    99+
    2023-06-16
  • 数据分析:麦当劳食品营养数据探索并可视化
    系列文章目录 作者:i阿极 作者简介:Python领域新星作者、多项比赛获奖者:博主个人首页 😊😊😊如果觉得文章不错或能帮助到你学习,可以点赞...
    99+
    2023-09-11
    数据分析 python 数据挖掘 开发语言
  • 用 Python 绘制数据风景:探索可视化的艺术
    数据可视化是数据分析和探索中至关重要的一步。它允许您以直观的方式传达复杂的数据模式和趋势,从而更容易识别见解和做出明智的决策。Python 是一种强大的编程语言,提供了一系列绘图库,可用于创建令人惊叹的数据可视化。其中最受欢迎的有 ma...
    99+
    2024-03-07
    Python、数据可视化、绘图库、matplotlib、seaborn、数据探索
  • Python pyecharts数据可视化实例详解
    目录一、数据可视化1.pyecharts介绍2.初入了解(1).快速上手(2).简单的配置项介绍3.案例实战(1).柱状图Bar(2).地图Map(3).饼图Pie(4).折线图Li...
    99+
    2024-04-02
  • 超越图表:使用 Python 探索数据可视化的创新
    超越传统的图表 图表是数据可视化的一种经典形式,但它们往往受到限制,无法有效传达复杂的数据集或揭示隐藏的见解。Python 提供了丰富的库和框架,使数据科学家和分析师能够超越图表,创造交互式、引人入胜的可视化效果。 交互式可视化 交互式...
    99+
    2024-03-07
    数据可视化、Python、图表、探索性数据分析、交互式可视化
  • python数据可视化plt库实例详解
    先看下jupyter和pycharm环境的差别 左边是jupyter---------------------------------------------------------...
    99+
    2024-04-02
  • Python数据可视化绘图实例详解
    目录利用可视化探索图表1.数据可视化与探索图2.常见的图表实例数据探索实战分享1.2013年美国社区调查2.波士顿房屋数据集利用可视化探索图表 1.数据可视化与探索图 数据可视化是指...
    99+
    2024-04-02
  • Python echarts实现数据可视化实例详解
    目录1.概述2.安装3.数据可视化代码3.1 柱状图3.2 折线图3.3 饼图总结1.概述 pyecharts 是百度开源的,适用于数据可视化的工具,配置灵活,展示图表相对美观,顺滑...
    99+
    2024-04-02
  • 探索 VUE 与大数据可视化的无限潜力
    VUE.js 简介 VUE.js 是一种渐进式 JavaScript 框架,用于构建用户界面(UI)。它的灵活性、速度和响应式特性使其成为大数据可视化应用程序的理想选择。VUE.js 提供了丰富的工具,支持快速开发和维护复杂的交互式图表...
    99+
    2024-03-05
    VUE.js、大数据可视化、交互式图表、可定制仪表板
  • 数据的探险家:Python 数据可视化的罗盘
    Matplotlib:多功能绘图库 Matplotlib 是 Python 数据可视化中最流行的库之一,它提供了一系列绘图函数。从简单的折线图和柱状图到复杂的散点图和热力图,Matplotlib 涵盖了广泛的图表类型。其模块化设计允许高度...
    99+
    2024-04-02
  • Python利用Bokeh进行数据可视化的教程分享
    目录介绍代码1.散点标记代码2.单行代码3.条形图代码4.箱线图代码5.直方图代码6.散点图介绍 Bokeh是 Python 中的数据可视化库,提供高性能的交互式图表和绘图。Boke...
    99+
    2024-04-02
  • Python数据处理及可视化的示例分析
    这篇文章主要介绍Python数据处理及可视化的示例分析,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一、NumPy的初步使用表格是数据的一般表示形式,但对于机器来说是不可理解的,也就是无法辨识的数据,所以我们需要对表...
    99+
    2023-06-29
  • Python 数据可视化
    Python 数据可视化 Python提供了多个用于数据可视化的工具和库。其中最常用的包括: 1. Matplotlib:Matplotlib 是一个用于绘制二维图形的 Python 库。它提供了广泛的绘图选项,可以帮助您创建线图、散点图...
    99+
    2023-09-17
    python 数据分析 matplotlib
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作