广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python数据分析的方法是什么
  • 256
分享到

Python数据分析的方法是什么

2023-06-16 18:06:50 256人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

本篇内容介绍了“python数据分析的方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!01 指标拆解TGI计算公式中,有三个关键点需

本篇内容介绍了“python数据分析的方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

01 指标拆解

TGI计算公式中,有三个关键点需要进一步拆解:某一特征,总体,目标群体。

随便举个栗子,假设我们要研究A公司脱发TGI指数:

某一特征,就是我们想要分析的某种行为或者状态,这里是脱发(或者说受脱发困扰)

总体,是我们研究的所有对象,即A公司所有人

目标群体,是总体中我们感兴趣的一个分组,假设我们关注的分组是数据部,那目标群体就是数据部

于是乎,公式中分子“目标群体中具有某一特征的群体所占比例”可以理解为“数据部脱发人数占数据部的比例”,假设数据部有15个人,有9个人受脱发困扰,那数据部脱发人数占比就是9/15,等于60%。

而分母“总体中具有相同特征的群体所占比例”,等同于“全公司受脱发困扰人数占公司总人数的比例”,假设公司一共500人,有120人受脱发困扰,那这个比例是24%。

所以,数据部脱发TGI指数,可以用60% / 24% * 100 = 250,其他部门脱发TGI指数计算逻辑是一样的,用本部门脱发人数占比 /  公司脱发人数占比 * 100即可。

TGI指数大于100,代表着某类用户更具有相应的倾向或者偏好,数值越大则倾向和偏好越强;小于100,则说明该类用户相关倾向较弱(和平均相比);而等于100则表示在平均水平。

刚才的例子中,我们瞎掰的数据部脱发TGI指数是250,远远高于100,看来搞数据的脱发风险极高,数据才是真正的发际线推手。

下面,我们通过一个案例来巩固概念理解,顺便和潘大师(pandas)过过招。

02 TGI实例分析

项目背景

BOSS抛来一份订单明细,“小Z啊,我们最近要推出一款客单比较高的产品,打算在一些城市先试销,你看看这个数据,哪些城市的人有高客单偏好,帮我筛选5个吧”。

小Z赶紧打开表格,看看数据到底长什么样子:

Python数据分析的方法是什么

订单数据包括品牌名、买家姓名、付款时间、订单状态和地域等字段,一共28832条数据,没有空值。

粗略看了几眼源数据,小Z赶紧明确数据需求:“领导,那客单比较高的定义是什么?”

“就我们产品线和历史数据来看,单次购买大于50元就算高客单的客户了”。

确认了高客单之后,我们的目标非常明确:按照高客单偏好给城市做个排序。这里的偏好,可以用TGI指数来衡量,我们再次复习下TGI三个核心点:

  • 特征,高客单,即客户单次购买超过50元

  • 目标群体,就是各个城市,这里我们可以分别计算出所有城市客户的高客单偏好

  • 至于总体,就非常直白了,计算所涉及到的所有客户即为总体

解题的关键在于,计算出不同城市,高客单人数及所占的比例。

单个用户打标

第一步,我们先判断每个用户是否属于高客单的人群,所以先按用户昵称进行分组,看每位用户的平均支付金额。这里用平均,是因为有的客户多次购买,而每次下单金额也不一样,故平均之。

Python数据分析的方法是什么

接着,定义一个判断函数,如果单个用户平均支付金额大于50,就打上“高客单”的类别,否则为低客单,再用apply函数调用:

Python数据分析的方法是什么

到这里基于高低客单的用户初步打标已经完成。

匹配城市

单个用户的金额和客单标签已经搞定,下一步就是补充每个用户的地域字段,一句pd.merge函数就能搞定。由于源数据是未去重的,我们得先按昵称去重,不然匹配的结果会有许多重复的数据:

Python数据分析的方法是什么

高客单TGI指数计算

要计算每个城市高客单TGI指数,需要得到每个城市高客单、低客单的人数分别是多少。如果用excel的数据透视表处理起来就很简单,直接把省份和城市拖拽到行的位置,客单类别拖到列的位置,值随便选一个字段,只要是统计就好。

不要慌,这一套操作,Python实现起来也灰常容易,pivot_table透视表函数一行就搞定:

Python数据分析的方法是什么

这样得到的结果包含了层次化索引,受篇幅限制就不展开讲,我们只要知道要索引得到“高客单”列,需要先索引“买家昵称”,再索引“高客单”:

Python数据分析的方法是什么

这样,拿到了每个省市的高客单人数,然后再拿到低客单的人数,进行横向合并:

Python数据分析的方法是什么

我们再看看每个城市总人数以及高客单人数占比,来完成“目标群体中具有某一特征的群体所占比例”这个分子的计算:

Python数据分析的方法是什么

有些非常小众的城市,高客单或者低客单人数等于1甚至没有,而这些值尤其是空值会影响结果的计算,我们要提前检核数据:

Python数据分析的方法是什么

果然,高客单和低客单都有空值(可以理解为0),从而导致总人数也存在空值,而TGI指数对于空值来说意义不大,所以我们剔除掉存在空值的行:

Python数据分析的方法是什么

接着统计总人数中,高客单人群的比例,来对标公式中的分母“总体中具有相同特征的群体所占比例”:

Python数据分析的方法是什么

最后一步,就是TGI指数的计算,顺便排个序:

Python数据分析的方法是什么

出了结果,小Z兴致勃勃的打算第一时间报告老板,说时迟那时快,在按下回车之前又扫了一眼数据,发现了一个严重的问题:高客单TGI指数排名靠前的城市,总客户数几乎不超过10人,这样的高客单人口占比,完全没有说服力。

TGI指数能够显示偏好的强弱,但很容易让人忽略具体的样本量大小,这个是需要格外注意的。

怎么办呢?为了加强数据整体的信度,小Z决定先对总人数进行筛选,用总人数的平均值作为阈值,只保留总人数大于平均值的城市:

Python数据分析的方法是什么

“Python数据分析的方法是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

--结束END--

本文标题: Python数据分析的方法是什么

本文链接: https://www.lsjlt.com/news/284672.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python数据分析的方法是什么
    本篇内容介绍了“Python数据分析的方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!01 指标拆解TGI计算公式中,有三个关键点需...
    99+
    2023-06-16
  • python天气数据爬取与分析的方法是什么
    Python天气数据爬取与分析的方法主要包括以下几个步骤:1. 确定数据来源:选择一个合适的天气数据源,可以通过网站API获取天气数...
    99+
    2023-10-12
    python
  • python数据分析指的是什么
    这篇文章给大家分享的是有关python数据分析指的是什么的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。python有哪些常用库python常用的库:1.requesuts;2.scrapy;3.pillow;4....
    99+
    2023-06-14
  • Python爬取天气数据及可视化分析的方法是什么
    这篇文章主要讲解了“Python爬取天气数据及可视化分析的方法是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python爬取天气数据及可视化分析的方法是什么”吧!1、数据获取请求网站链...
    99+
    2023-07-06
  • r语言数据分析的实现方法是什么
    R语言是一种功能强大的编程语言和环境,特别适用于数据分析。以下是R语言实现数据分析的一般方法:1. 数据导入:使用R语言中的函数从各...
    99+
    2023-09-15
    r语言
  • Python数据分析 Numpy 的使用方法
    目录简介多维数组创建数组的数据类型数组维度简介 使用 Python 进行数据分析时,比较常用的库有 Numpy、Pandas、Matplotlib,本篇文章就来说一下 Numpy 的...
    99+
    2022-11-11
  • 数据分析的方法
    数据分析的方法有:对比分析法,分组分析法,预测分析法,漏斗分析法,AB测试分析法,象限分析法,公式拆解法,可行域分析法,二八分析法,假设性分析法。数据分析的方法有:对比分析法,分组分析法,预测分析法,漏斗分析法,AB测试分析法,象限分析法,...
    99+
    2023-07-10
  • android解析json数据的方法是什么
    Android中解析JSON数据的方法有多种,下面列举了几种常用的方法:1. 使用JSONObject和JSONArray:首先将J...
    99+
    2023-10-18
    android json
  • Python进行数据相关性分析的三种方式是什么
    本文小编为大家详细介绍“Python进行数据相关性分析的三种方式是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python进行数据相关性分析的三种方式是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。相...
    99+
    2023-06-30
  • python根据数据画图的方法是什么
    在Python中,有多种方法可以根据数据进行绘图。以下是其中几种常用的方法:1. Matplotlib:Matplotlib是一个功...
    99+
    2023-08-17
    python
  • Android解析JSON数据的方法分析
    本文实例讲述了Android解析JSON数据的方法。分享给大家供大家参考,具体如下: JSON作为一种“轻量”的数据结构传递数据,在JS中有广泛的应用 Google公司对JSO...
    99+
    2022-06-06
    json数据 JSON 方法 Android
  • python数组切片分段的方法是什么
    在Python中,可以使用切片(Slice)来对数组进行分段。切片的语法是:`array[start:end:step]`。- `s...
    99+
    2023-10-12
    python
  • 常用的数据分析方法
    常用的数据分析方法有:1、对比分析法;2、分组分析法;3、结构分析法;4、留存分析法;5、交叉分析法;6、漏斗分析法;7、矩阵分析法;8、象限分析法;9、趋势分析法;10、指标分析法;11、综合评价分析法。其中“对比分析法”是对数据进行比较...
    99+
    2023-07-10
  • python导入csv数据的方法是什么
    在Python中,可以使用`csv`模块来导入CSV数据。首先,需要导入`csv`模块:```pythonimport csv```...
    99+
    2023-09-12
    python
  • Python中的数据清洗方法是什么
    这里数据清洗需要用到的库是pandas库,下载方式还是在终端运行 : pip install pandas.首先我们需要对数据进行读取import pandas as pd data = pd.read_csv(r'E:\PYt...
    99+
    2023-05-14
    Python
  • Python的三大开源数据分析工具是什么
    本文小编为大家详细介绍“Python的三大开源数据分析工具是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python的三大开源数据分析工具是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。在大数据库领域...
    99+
    2023-06-02
  • Python数据分析Pandas Dataframe排序操作的方法
    本文小编为大家详细介绍“Python数据分析Pandas Dataframe排序操作的方法”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python数据分析Pandas Dataframe排序操作的方法”文章能帮助大家...
    99+
    2023-06-30
  • java分页数据提交的方法是什么
    在Java中,分页数据提交通常使用HTTP请求,其中常见的方法有GET和POST。GET方法是通过URL参数传递分页数据,例如:``...
    99+
    2023-08-19
    java
  • mongodb分片数据恢复的方法是什么
    MongoDB分片数据恢复的方法主要有以下几种:1. 使用备份和恢复工具:可以使用MongoDB提供的mongodump和mongo...
    99+
    2023-08-23
    mongodb
  • Python解析JSON数据的方法
    Python解析JSON数据的方法 在Python中,我们可以使用内置的json模块来解析JSON数据。下面是一个简单的例子: import json# JSON数据json_str = '{"nam...
    99+
    2023-09-01
    python json 开发语言
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作