iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >用python的seaborn画数值箱型图
  • 720
分享到

用python的seaborn画数值箱型图

2024-04-02 19:04:59 720人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

目录 一、概念介绍二、数据展示 三、数据导入  四、画图总结 一、概念介绍 箱型图(box-plot),又称为箱线图,盒型图,盒须图

 一、概念介绍

箱型图(box-plot),又称为箱线图,盒型图,盒须图。在数据探索阶段或者描述性分析过程中,我们常常用于展示多类连续型数据的数值分布情况,便于类间对比和快速识别异常值。

在一幅箱型图中,一个连续数值序列构成一个盒子,如下所示。

每一个盒子主要展示的是数据的上四分位数Q1(25%),中位数(50%),下四分位数Q3(75%)。划分异常值的界限我们称为上下极限,其离Q1,Q3分别是1.5IQR(IQR=Q3-Q1,称作四分位距)的距离,在上下极限之外的点,我们称为异常点。异常值在不同场景中受到不同的重视,如果是要研究目标群体的薪资水平,我们常常关注中位数和IQR,而不关注异常值。

二、数据展示

        借助爬虫技术,我们在某个时间的boss直聘首页随机获取了八个城市的三类检索词(数据分析师、数据挖掘工程师、算法工程师)的职位发布信息。一共得到的excel表如下所示。

每一个表内的数据如下:

(其中平均月薪的计算是简单地通过区间中位数*薪期/12得到,如8k-10k*16薪,则平均月薪为12000.

 三、数据导入

 只需要导入每一个表格中的 职位名称  和 平均月薪  列。

import pandas as pd
city8_fullname = ['北京','重庆','武汉','深圳','南京','广州','成都','上海']
job_type = ['数据分析师','数据挖掘工程师','算法工程师']
salary_dic = {}
for i in range(len(city8_fullname)):
    df = pd.DataFrame(pd.read_excel('./Boss直聘数据-八个城市/Boss直聘-'+city8_fullname[i]+'.xls'))
    salary_dic[city8_fullname[i]] = df[['职位名称','平均月薪']]
    salary_dic[city8_fullname[i]]['城市'] = pd.Series([city8_fullname[i]]*df.shape[0])
## 整合成画图需要的格式
salary = salary_dic[city8_fullname[0]]
for i in range(1,8):
    salary = pd.concat([salary,salary_dic[city8_fullname[i]]],ignore_index="true")

 得到的数据结构为:

  四、画图

 这里,我们使用的是python语言,借助seaborn包完成。

 
import matplotlib.pyplot as plt
import seaborn as sns
 
# 中文与正负号显示设置
plt.rcParams['font.sans-serif'] = 'Microsoft YaHei'
plt.rcParams['axes.unicode_minus'] = False
# Draw
plt.figure(figsize=(14,8), dpi= 100)
sns.boxplot(x='城市', y='平均月薪', data=salary, hue='职位名称')
sns.stripplot(x='城市', y='平均月薪', data=salary, color='black', size=2, jitter=1)
for i in range(len(salary['城市'].unique())-1):
    plt.vlines(i+.5, 10, 45, linestyles='solid', colors='gray', alpha=0.2)
plt.title('八大城市对口专业薪资分布', fontsize=20)
plt.legend(title='职位类型')
plt.xticks(fontsize=14)
plt.xlabel('城市',fontsize=16)
plt.ylabel('平均月薪',fontsize=16)
plt.yticks(fontsize=14)
plt.savefig(r'./绘图结果/薪资-薪资分布-箱线图.png')

sns.stripplot------用于画分布散点图(如果是大样本的话不适用,但有一种一半密度一半箱型的类别,可以避免散点覆盖的情况 )

plt.vlines-----画辅助线

hue-----可以理解为有多少组,在这里相当于出去城市外的第二个维度的分类。

结果图为:

 上图中,我们是在箱型图的基础上加了散点的,目的在于了解各城市薪资的数值集中分布情况。

总结

到此这篇关于用Python的seaborn画数值箱型图的文章就介绍到这了,更多相关python seaborn箱型图内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: 用python的seaborn画数值箱型图

本文链接: https://www.lsjlt.com/news/162621.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 用python的seaborn画数值箱型图
    目录 一、概念介绍二、数据展示 三、数据导入  四、画图总结 一、概念介绍 箱型图(box-plot),又称为箱线图,盒型图,盒须图...
    99+
    2024-04-02
  • 怎么用python的seaborn画数值箱型图
    这篇文章主要为大家展示了“怎么用python的seaborn画数值箱型图”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“怎么用python的seaborn画数值箱型图”这篇文章吧。 一、...
    99+
    2023-06-26
  • python数据可视化Seaborn画热力图
    目录1.引言2. 栗子3. 数据预处理4. 画热力图5. 添加数值6. 调色板优化1.引言 热力图的想法很简单,用颜色替换数字。 现在,这种可视化风格已经从最初的颜色编码表格走了很...
    99+
    2024-04-02
  • python使用箱型图剔除异常值
    目录 箱型图 pandas.DataFrame.quantile 参数: 返回:(Series or DataFrame) 示例: 代码实现  参考 箱型图 将一组数据从大到小排列,分别计算出, 上四分位数𝑄3: 75%...
    99+
    2023-09-11
    python pandas
  • 如何使用python数据可视化Seaborn画热力图
    这篇文章主要为大家展示了“如何使用python数据可视化Seaborn画热力图”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“如何使用python数据可视化Seaborn画热力图”这篇文章吧。1....
    99+
    2023-06-22
  • 【数据分析入门】Seaborn[散点图、条形图、计数图、热力图、箱型图、小提琴图]
    这里写目录标题 一、数据二、画布外观2.1 Seaborn样式2.2 上下文函数2.3 调色板 三、使用 Seaborn 绘图3.1 坐标轴栅格3.2 各类图形3.2.1 散点图3.2.2...
    99+
    2023-09-18
    数据分析 数据挖掘 图像处理 python 人工智能
  • Python数据分布类型图(箱型图、直方图)
    本文示例:根据箱型图、直方图的代码和数据的条件查询方法,画出航空公司男性和女性用户的年龄分布箱型图和直方图。 目录 图形概念 1.箱型图 2.直方图 步骤: 1、导入相关库 2、对数据进行处理  3、绘制图形                ...
    99+
    2023-09-08
    python 开发语言
  • python使用箱型图剔除异常值的实现方法
    目录箱型图pandas.DataFrame.quantile参数:返回:(Series or DataFrame)示例:代码实现 参考总结箱型图 将一组数据从大到小排列,...
    99+
    2023-05-19
    箱形图剔除异常值 python箱形图 python异常值处理
  • Python编程使用matplotlib挑钻石seaborn画图入门教程
    目录scatter_plotlmplotjointplot挑钻石第二弹 seaborn是matplotlib的补充包,提供了一系列高颜值的figure,并且集成了多种在线数据集,通过...
    99+
    2024-04-02
  • 基于Python的数据可视化库之Seaborn的图表类型
    作者:禅与计算机程序设计艺术 《基于Python的数据可视化库之 Seaborn 的图表类型》 作为一位人工智能专家,我经常需要使用数据可视化工具来处理和分析大量的数据。在Python中,Seabo...
    99+
    2023-10-04
    自然语言处理 人工智能 语言模型 编程实践 开发语言 架构设计
  • Python调用Matplotlib绘制振动图、箱型图和提琴图
    目录Matplotlib介绍振动图箱型图提琴图Matplotlib介绍 Matplotlib 是一款用于数据可视化的 Python 软件包,支持跨平台运行,它能够根据 NumPy  ...
    99+
    2024-04-02
  • Python利用matplotlib.pyplot.boxplot()绘制箱型图实例代码
    目录一、matplotlib.pyplot.boxplot()语法二、绘制箱型图①绘制简单箱型图②各个参数绘制箱型图(1)notch参数(bool值,是否凹口的形式展现箱线图,默认值...
    99+
    2024-04-02
  • 如何使用python数据可视化Seaborn绘制山脊图
    这篇文章主要介绍如何使用python数据可视化Seaborn绘制山脊图,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!1. 引言山脊图一般由垂直堆叠的折线图组成,这些折线图中的折线区域间彼此重叠,此外它们还共享相同的x...
    99+
    2023-06-22
  • Python怎么调用Matplotlib绘制振动图、箱型图和提琴图
    本篇内容介绍了“Python怎么调用Matplotlib绘制振动图、箱型图和提琴图”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Matplo...
    99+
    2023-06-21
  • Python实现Matplotlib,Seaborn动态数据图的示例代码
    目录MatplotlibSeabornMatplotlib 效果图如下 主要使用matplotlib.animation.FuncAnimation,上核心代码, # 定义静态绘图...
    99+
    2024-04-02
  • Python用什么函数画折线图
    Python中使用matplotlib函数画折线图,具体方法如下:import numpy as np #导入numpy模块import matplotlib.pyplot as plt #导入matplotlib模块x = np.lins...
    99+
    2024-04-02
  • Python直接使用plot()函数画图
    目录 一、plot()函数的认识 二、plot()函数基本运用  三、plot()函数数据可视化画图以及图元基本参数设置 一、plot()函数的认识 在使用Python进行数据可视化编程中matplotlib库是我们用来对数据进行画图常用...
    99+
    2023-09-06
    python
  • Python数据可视化之Seaborn的使用详解
    目录1. 安装 seaborn2.准备数据3.背景与边框3.1 设置背景风格3.2 其他3.3 边框控制4. 绘制 散点图5. 绘制 折线图5.1 使用 replot()方法5.2 ...
    99+
    2024-04-02
  • python数值类型如何使用
    本篇内容介绍了“python数值类型如何使用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1、数值类型之间都是可以相互转化的,两种不同类型相...
    99+
    2023-06-30
  • python中的subplot函数如何画图
    这篇文章主要介绍“python中的subplot函数如何画图”,在日常操作中,相信很多人在python中的subplot函数如何画图问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python中的subplot...
    99+
    2023-06-30
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作