iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >浅谈四种快速易用的Python数据可视化方法
  • 409
分享到

浅谈四种快速易用的Python数据可视化方法

Python数据Python数据可视化 2023-05-15 08:05:20 409人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

目录热力图二维密度图蜘蛛网图树状图数据可视化是数据科学或机器学习项目中十分重要的一环。通常,你需要在项目初期进行探索性的数据分析(EDA),从而对数据有一定的了解,而且创建可视化确实

数据可视化是数据科学或机器学习项目中十分重要的一环。通常,你需要在项目初期进行探索性的数据分析(EDA),从而对数据有一定的了解,而且创建可视化确实可以使分析的任务更清晰、更容易理解,特别是对于大规模的高维数据集。在项目接近尾声时,以一种清晰、简洁而引人注目的方式展示最终结果也是非常重要的,让你的受众(通常是非技术人员的客户)能够理解。

热力图

热力图(Heat Map)是数据的一种矩阵表示方法,其中每个矩阵元素的值通过一种颜色表示。不同的颜色代表不同的值,通过矩阵的索引将需要被对比的两项或两个特征关联在一起。热力图非常适合于展示多个特征变量之间的关系,因为你可以直接通过颜色知道该位置上的矩阵元素的大小。通过查看热力图中的其他点,你还可以看到每种关系与数据集中的其它关系之间的比较。颜色是如此直观,因此它为我们提供了一种非常简单的数据解释方式。

现在让我们来看看实现代码。与「matplotlib」相比,「seaborn」可以被用于绘制更加高级的图形,它通常需要更多的组件,例如多种颜色、图形或变量。「matplotlib」可以被用于显示图形,「NumPy」可被用于生成数据,「pandas」可以被用于处理数据!绘图只是「seaborn」的一个简单的功能。

# Importing libs
import seaborn as sns
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Create a random dataset
data = pd.DataFrame(np.random.random((10,6)), columns=["Iron Man","Captain America","Black Widow","Thor","Hulk", "Hawkeye"])

print(data)

# Plot the heatmap
heatmap_plot = sns.heatmap(data, center=0, cmap='GISt_ncar')

plt.show()

二维密度图

二维密度图(2D Density Plot)是一维版本密度图的直观扩展,相对于一维版本,其优点是能够看到关于两个变量的概率分布。例如,在下面的二维密度图中,右边的刻度图用颜色表示每个点的概率。我们的数据出现概率最大的地方(也就是数据点最集中的地方),似乎在 size=0.5,speed=1.4 左右。正如你现在所知道的,二维密度图对于迅速找出我们的数据在两个变量的情况下最集中的区域非常有用,而不是像一维密度图那样只有一个变量。当你有两个对输出非常重要的变量,并且希望了解它们如何共同作用于输出的分布时,用二维密度图观察数据是十分有效的。

事实再次证明,使用「seaborn」编写代码是十分便捷的!这一次,我们将创建一个偏态分布,让数据可视化结果更有趣。你可以对大多数可选参数进行调整,让可视化看结果看起来更清楚。

# Importing libs
import seaborn as sns
import matplotlib.pyplot as plt
from scipy.stats import skewnORM

# Create the data
speed = skewnorm.rvs(4, size=50) 
size = skewnorm.rvs(4, size=50)

# Create and shor the 2D Density plot
ax = sns.kdeplot(speed, size, cmap="Reds", shade=False, bw=.15, cbar=True)
ax.set(xlabel='speed', ylabel='size')
plt.show()

蜘蛛网图

蜘蛛网图(Spider Plot)是显示一对多关系的最佳方法之一。换而言之,你可以绘制并查看多个与某个变量或类别相关的变量的值。在蜘蛛网图中,一个变量相对于另一个变量的显著性是清晰而明显的,因为在特定的方向上,覆盖的面积和距离中心的长度变得更大。如果你想看看利用这些变量描述的几个不同类别的对象有何不同,可以将它们并排绘制。在下面的图表中,我们很容易比较复仇者联盟的不同属性,并看到他们各自的优势所在!(请注意,这些数据是随机设置的,我对复仇者联盟的成员们没有偏见。)

在这里,我们可以直接使用「matplotlib」而非「seaborn」来创建可视化结果。我们需要让每个属性沿圆周等距分布。我们将在每个角上设置标签,然后将值绘制为一个点,它到中心的距离取决于它的值/大小。最后,为了显示更清晰,我们将使用半透明的颜色来填充将属性点连接起来得到的线条所包围的区域。

# Import libs
import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt

# Get the data
df=pd.read_csv("avengers_data.csv")
print(df)

"""
   #             Name  Attack  Defense  Speed  Range  Health
0  1         Iron Man      83       80     75     70      70
1  2  Captain America      60       62     63     80      80
2  3             Thor      80       82     83    100     100
3  3             Hulk      80      100     67     44      92
4  4      Black Widow      52       43     60     50      65
5  5          Hawkeye      58       64     58     80      65

"""

# Get the data for Iron Man
labels=np.array(["Attack","Defense","Speed","Range","Health"])
stats=df.loc[0,labels].values

# Make some calculations for the plot
angles=np.linspace(0, 2*np.pi, len(labels), endpoint=False)
stats=np.concatenate((stats,[stats[0]]))
angles=np.concatenate((angles,[angles[0]]))

# Plot stuff
fig = plt.figure()
ax = fig.add_subplot(111, polar=True)
ax.plot(angles, stats, 'o-', linewidth=2)
ax.fill(angles, stats, alpha=0.25)
ax.set_thetagrids(angles * 180/np.pi, labels)
ax.set_title([df.loc[0,"Name"]])
ax.grid(True)

plt.show()

树状图

我们从小学就开始使用树状图(Tree Diagram)了!树状图是自然而直观的,这使它们容易被解释。直接相连的节点关系密切,而具有多个连接的节点则不太相似。在下面的可视化结果中,我根据 Kaggle 的统计数据(生命值、攻击力、防御力、特殊攻击、特殊防御、速度)绘制了一小部分口袋妖怪游戏的数据集的树状图。

因此,统计意义上最匹配的口袋妖怪将被紧密地连接在一起。例如,在图的顶部,阿柏怪 和尖嘴鸟是直接连接的,如果我们查看数据,阿柏怪的总分为 438,尖嘴鸟则为 442,二者非常接近!但是如果我们看看拉达,我们可以看到其总得分为 413,这和阿柏怪、尖嘴鸟就具有较大差别了,所以它们在树状图中是被分开的!当我们沿着树往上移动时,绿色组的口袋妖怪彼此之间比它们和红色组中的任何口袋妖怪都更相似,即使这里并没有直接的绿色的连接。

对于树状图,我们实际上需要使用「Scipy」来绘制!读取数据集中的数据之后,我们将删除字符串列。这么做只是为了使可视化结果更加直观、便于理解,但在实践中,将这些字符串转换为分类变量会得到更好的结果和对比效果。我们还设置了数据帧的索引,以便能够恰当地将其用作引用每个节点的列。最后需要告诉大家的是,在「Scipy」中计算和绘制树状图只需要一行简单的代码。

# Import libs
import pandas as pd
from matplotlib import pyplot as plt
from scipy.cluster import hierarchy
import numpy as np

# Read in the dataset
# Drop any fields that are strings
# Only get the first 40 because this dataset is big
df = pd.read_csv('Pokemon.csv')
df = df.set_index('Name')
del df.index.name
df = df.drop(["Type 1", "Type 2", "Legendary"], axis=1)
df = df.head(n=40)

# Calculate the distance between each sample
Z = hierarchy.linkage(df, 'ward')

# Orientation our tree
hierarchy.dendrogram(Z, orientation="left", labels=df.index)

plt.show()

到此这篇关于浅谈四种快速易用的python数据可视化方法的文章就介绍到这了,更多相关Python数据可视化方法内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: 浅谈四种快速易用的Python数据可视化方法

本文链接: https://www.lsjlt.com/news/208502.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 浅谈四种快速易用的Python数据可视化方法
    目录热力图二维密度图蜘蛛网图树状图数据可视化是数据科学或机器学习项目中十分重要的一环。通常,你需要在项目初期进行探索性的数据分析(EDA),从而对数据有一定的了解,而且创建可视化确实...
    99+
    2023-05-15
    Python数据 Python数据可视化
  • 快速易用的Python数据可视化方法有哪些
    这篇文章主要介绍“快速易用的Python数据可视化方法有哪些”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“快速易用的Python数据可视化方法有哪些”文章能帮助大家解决问题。数据可视化是数据科学或机...
    99+
    2023-07-05
  • Python数据可视化系列-01-快速绘
    数据图绘制 matplotlib的字库pyplot提供了快速绘制2D图标的API接口。 import numpy as np import matplotlib.pyplot as plt x = np.linspace(0...
    99+
    2023-01-30
    快速 系列 数据
  • Python数据可视化的方法
    这篇“Python数据可视化的方法”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Python数据可视化的方法”文章吧。一、数...
    99+
    2023-06-30
  • 浅谈Python几种常见的归一化方法
    目录一:归一化的概念二:归一化的作用三:归一化的类型1:线性归一化2:零-均值归一化(Z-score标准化)3:小数定标规范化4:非线性归一化 四:批归一化(BatchNo...
    99+
    2023-05-14
    Python Python常见 Python归一化
  • 浅谈Java中浮点型数据保留两位小数的四种方法
    目录一、String类的方式二、DecimalFormat类三、BigDecimal类进行数据处理四、NumberFormat类进行数据处理总结一下今天在进行开发的过程中遇到了一个小...
    99+
    2024-04-02
  • python数据可视化matplotlib.pyplot的用法
    这篇文章主要介绍“python数据可视化matplotlib.pyplot的用法”,在日常操作中,相信很多人在python数据可视化matplotlib.pyplot的用法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对...
    99+
    2023-06-20
  • 浅谈数据库缓存最终一致性的四种方案
    背景 缓存是软件开发中一个非常有用的概念,数据库缓存更是在项目中必然会遇到的场景。而缓存一致性的保证,更是在面试中被反复问到,这里进行一下总结,针对不同的要求,选择恰到好处的一致性方...
    99+
    2024-04-02
  • Python数值方法及数据可视化
    随机数和蒙特卡洛模拟求解单一变量非线性方程求解线性系统方程函数的数学积分常微分方程的数值解 等势线绘图和曲线: 等势线  import numpy as np impor...
    99+
    2024-04-02
  • python用pyecharts实现地图数据可视化的方法
    这篇文章给大家分享的是有关python用pyecharts实现地图数据可视化的方法的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。有的时候,我们需要对不同国家或地区的某项指标进行比较,可简单通过直方图加以比较。但直...
    99+
    2023-06-14
  • python数据可视化JupyterLab实用方法是什么
    这篇文章主要介绍“python数据可视化JupyterLab实用方法是什么”,在日常操作中,相信很多人在python数据可视化JupyterLab实用方法是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”p...
    99+
    2023-06-25
  • 浅谈Pandas dataframe数据处理方法的速度比较
    数据修改主要以增删改差为主,这里比较几种写法在数据处理时间上的巨大差别。 数据量大概是500万行级别的数据,文件大小为100M。 1.iloc iloc是一种速度极其慢的写法。这里我...
    99+
    2024-04-02
  • Python数据结构之递归可视化的方法
    今天小编给大家分享一下Python数据结构之递归可视化的方法的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。1.学习目标递归函...
    99+
    2023-06-30
  • Python pyecharts 数据可视化模块的配置方法
    目录1. pyecharts 模块介绍2. pyecharts 模块安装3. pyecharts 配置选项3.1 全局配置选项3.2 系列配置选项4. 基础折线图的构建4.1 基本使...
    99+
    2024-04-02
  • Python中seaborn库之countplot数据可视化的使用方法
    这篇文章给大家分享的是有关Python中seaborn库之countplot数据可视化的使用方法的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。在Python数据可视化中,seaborn较好的提供了图形的一些可视化...
    99+
    2023-06-15
  • 揭秘 Python 数据可视化的魔法
    Matplotlib:基础绘图库 Matplotlib 是一个灵活且功能强大的 2D 绘图库,它提供了一系列函数来创建各种类型的图表。 import matplotlib.pyplot as plt # 创建一个简单的折线图 plt.p...
    99+
    2024-03-07
    数据可视化 Python Matplotlib Seaborn Plotly
  • 浅谈MySQL数据同步到 Redis 缓存的几种方法
    目录1 mysql查完数据,再同步写入到Redis中2 Mysql查完数据,通过发送MQ,在消费者线程去同步Redis3 订阅Mysql的Binlog文件(可借助Canal来进行)4 延迟双删5 延迟双写6 总结1 My...
    99+
    2023-03-19
    MySQL数据同步到Redis缓存 MySQL数据同步
  • 浅谈MySQL数据同步到Redis缓存的几种方法
    目录1 Mysql查完数据,再同步写入到Redis中2 Mysql查完数据,通过发送MQ,在消费者线程去同步Redis3 订阅Mysql的Binlog文件(可借助Canal来进行)4...
    99+
    2023-03-19
    MySQL数据同步到Redis缓存 MySQL数据同步
  • 数据可视化中的Python问题及解决方法
    数据可视化中的Python问题及解决方法数据可视化是数据科学领域中一个非常重要的任务,通过可视化我们能够更直观地理解和分析数据,为决策提供有力的支持。Python作为一种流行的编程语言,在数据可视化方面有着广泛的应用。然而,在实践中,我们经...
    99+
    2023-10-22
    Python 问题 数据可视化 解决方法
  • 使用Python对网易云歌单数据分析及可视化
    目录项目概述1.1项目来源1.2需求描述数据获取2.1数据源的选取2.2数据的获取2.2.1 设计2.2.2 实现2.2.3 效果 数据预处理3.1 设计3.2 实现3.3...
    99+
    2023-03-22
    Python网易云歌单数据分析 python数据可视化
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作