返回顶部
首页 > 资讯 > 后端开发 > Python >怎么利用Python进行客户分群分析
  • 922
分享到

怎么利用Python进行客户分群分析

2023-07-05 05:07:13 922人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要讲解了“怎么利用python进行客户分群分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么利用Python进行客户分群分析”吧!导入数据和python库import 

这篇文章主要讲解了“怎么利用python进行客户分群分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么利用Python进行客户分群分析”吧!

导入数据和python库

import pandas as pd  import matplotlib.pyplot as plt  import seaborn as sns  df = pd.read_csv('sales_2018-01-01_2019-12-31.csv')  df

怎么利用Python进行客户分群分析

分离新老客户

first_time = df.loc[df['customer_type'] == 'First-time',]  final = df.loc[df['customer_id'].isin(first_time['customer_id'].values)]

在这里,不能简单地选择df.loc[df['customer_type']],因为在这个数据中,在customer_type列下,First_time指的是新客户,而Returning指的是老客户。因此,如果我在2019年12月31日第一次购买,数据会显示我在2019年12月31日是新客户,但在我第二次、第三次…时是返回客户。同期群分析着眼于新客户和他们的后续购买行为。因此,如果我们简单地使用df.loc[df['customer_type']=='First-time',],我们就会忽略新客户的后续购买,这不是分析同期群行为的正确方法。

因此,这里所需要做的是,首先创建一个所有第一次的客户列表,并将其存储为first_time。然后从原始客户数据框df中只选择那些ID在first_time客户组内的客户。通过这样做,我们可以确保我们获得的数据只有第一次的客户和他们后来的购买行为。

现在,我们删除customer_type列,因为它已经没有必要了。同时,将日期列转换成正确的日期时间格式

final = final.drop(columns = ['customer_type'])  final['day']= pd.to_datetime(final['day'], dayfirst=True)

按客户ID排序,然后是日期

final = final.drop(columns = ['customer_type'])  final['day']= pd.to_datetime(final['day'], dayfirst=True)

怎么利用Python进行客户分群分析

定义一些函数

def purchase_rate(customer_id):      purchase_rate = [1]      counter = 1      for i in range(1,len(customer_id)):            if customer_id[i] != customer_id[i-1]:                   purchase_rate.append(1)                   counter = 1            else:                   counter += 1                   purchase_rate.append(counter)      return purchase_rate  def join_date(date, purchase_rate):      join_date = list(range(len(date)))      for i in range(len(purchase_rate)):             if purchase_rate[i] == 1:                   join_date[i] = date[i]            else:                   join_date[i] = join_date[i-1]      return join_date  def age_by_month(purchase_rate, month, year, join_month, join_year):      age_by_month = list(range(len(year)))      for i in range(len(purchase_rate)):            if purchase_rate[i] == 1:                age_by_month[i] = 0            else:                if year[i] == join_year[i]:                   age_by_month[i] = month[i] - join_month[i]                else:                   age_by_month[i] = month[i] - join_month[i] + 12*(year[i]-join_year[i])       return age_by_month
  • purchase_rate函数将决定这是否是每个客户的第二次、第三次、第四次购买。

  • join_date函数允许确定客户加入的日期。

  • age_by_month函数提供了从客户当前购买到第一次购买的多少个月。

现在输入已经准备好了,接下来创建群组。

创建群组

final['month'] =pd.to_datetime(final['day']).dt.month  final['Purchase Rate'] = purchase_rate(final['customer_id'])  final['Join Date'] = join_date(final['day'], final['Purchase Rate'])  final['Join Date'] = pd.to_datetime(final['Join Date'], dayfirst=True)  final['cohort'] = pd.to_datetime(final['Join Date']).dt.strftime('%Y-%m')  final['year'] = pd.to_datetime(final['day']).dt.year  final['Join Date Month'] = pd.to_datetime(final['Join Date']).dt.month  final['Join Date Year'] = pd.to_datetime(final['Join Date']).dt.year

怎么利用Python进行客户分群分析

final['Age by month'] = age_by_month(final['Purchase Rate'],                                        final['month'],                                       final['year'],                                       final['Join Date Month'],                                       final['Join Date Year'])

怎么利用Python进行客户分群分析

cohorts = final.groupby(['cohort','Age by month']).nunique()  cohorts = cohorts.customer_id.to_frame().reset_index()   # convert series to frame  cohorts = pd.pivot_table(cohorts, values = 'customer_id',index = 'cohort', columns= 'Age by month')  cohorts.replace(np.nan, '',regex=True)

怎么利用Python进行客户分群分析

**如何解释这个表格:**以群组2018-01为例。在2018年1月,有462名新客户。在这462人中,121名客户在2018年2月回来购买,125名在2018年3月购买,以此类推。

转换为群组百分比

for i in range(len(cohorts)-1):      cohorts[i+1] = cohorts[i+1]/cohorts[0]  cohorts[0] = cohorts[0]/cohorts[0]

怎么利用Python进行客户分群分析

可视化

cohorts_t = cohorts.transpose()  cohorts_t[cohorts_t.columns].plot(figsize=(10,5))  sns.set(style='whitegrid')  plt.figure(figsize=(20, 15))  plt.title('Cohorts: User Retention')  sns.set(font_scale = 0.5) # font size  sns.heatmap(cohorts, mask=cohorts.isnull(),  cmap="Blues",  annot=True, fmt='.01%')  plt.show()

怎么利用Python进行客户分群分析

怎么利用Python进行客户分群分析

感谢各位的阅读,以上就是“怎么利用Python进行客户分群分析”的内容了,经过本文的学习后,相信大家对怎么利用Python进行客户分群分析这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

--结束END--

本文标题: 怎么利用Python进行客户分群分析

本文链接: https://www.lsjlt.com/news/349921.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 怎么利用Python进行客户分群分析
    这篇文章主要讲解了“怎么利用Python进行客户分群分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么利用Python进行客户分群分析”吧!导入数据和python库import ...
    99+
    2023-07-05
  • 详解如何利用Python进行客户分群分析
    目录导入数据和python库分离新老客户按客户ID排序,然后是日期定义一些函数创建群组转换为群组百分比可视化每个电子商务数据分析师必须掌握的一项数据聚类技能 如果你是一名在电子商务公...
    99+
    2023-02-24
    Python实现客户分群分析 Python客户分群分析 Python客户分析
  • 怎么用python进行客户价值分析
    今天就跟大家聊聊有关怎么用python进行客户价值分析,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。一个完整的数据分析项目由如下几个步骤组成:1)数据获取:分为本地文本文件、数据库链...
    99+
    2023-06-02
  • 怎么使用Python进行同期群分析
    本篇内容主要讲解“怎么使用Python进行同期群分析”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么使用Python进行同期群分析”吧!同期群分析同期群分析概念同期群(Cohort)的字面意思...
    99+
    2023-07-05
  • 怎么利用python进行数值分析
    小编给大家分享一下怎么利用python进行数值分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!一、准备噪声是在拟合过程中常用的干扰手段,常用的噪声:统一分布 U(a,b)f ( x ) = { 1 i f a ≤ x &...
    99+
    2023-06-15
  • 使用Python进行同期群分析(CohortAnalysis)
    同期群分析 同期群分析概念 同期群(Cohort)的字面意思(有共同特点或举止类同的)一群人,比如不同性别,不同年龄。 在《精益数据分析》中的第2章 创业的记分牌 中介绍了三种分析方...
    99+
    2023-03-24
    Python 实现同期群分析 同期群分析Python实战
  • 利用Python进行数据分析_Panda
    申明:本系列文章是自己在学习《利用Python进行数据分析》这本书的过程中,为了方便后期自己巩固知识而整理。 import pandas as pd import numpy as np file = 'D:\example.xls'...
    99+
    2023-01-30
    数据 Python _Panda
  • 怎么利用spark进行数据分析
    要利用Spark进行数据分析,首先需要安装和配置Spark环境,并了解Spark的基本概念和API。然后可以按照以下步骤进行数据分析...
    99+
    2024-04-02
  • 利用Pytorch进行CNN分析
    这篇文章主要介绍“利用Pytorch进行CNN分析”,在日常操作中,相信很多人在利用Pytorch进行CNN分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”利用Pytorc...
    99+
    2024-04-02
  • 怎么用Python进行数据分析
    这篇文章主要讲解了“怎么用Python进行数据分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么用Python进行数据分析”吧!评论情感倾向先调用百度AI来分析微博和b站的评论情感倾向。...
    99+
    2023-06-01
  • 怎么在Python中利用Spacy进行分词
    本篇文章给大家分享的是有关怎么在Python中利用Spacy进行分词,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。python是什么意思Python是一种跨平台的、具有解释性、...
    99+
    2023-06-14
  • 怎么用Python进行帕累托分析
    这篇文章主要介绍“怎么用Python进行帕累托分析”,在日常操作中,相信很多人在怎么用Python进行帕累托分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么用Python进行帕累托分析”的疑惑有所帮助!...
    99+
    2023-06-15
  • 怎么使用Python进行数据分析
    使用Python进行数据分析可以通过以下几个步骤:1. 安装Python和相关库:首先需要安装Python解释器,推荐使用Anaco...
    99+
    2023-08-23
    Python
  • 教你如何利用python进行数值分析
    目录一、准备二、三次样条插值三、最小二乘拟合四、拉格朗日乘子法一、准备 噪声是在拟合过程中常用的干扰手段,常用的噪声: 1.统一分布 U(a,b) f ( x ) = { 1 i f...
    99+
    2024-04-02
  • 怎样利用Python对心脏病数据集进行分析
    这篇文章将为大家详细讲解有关怎样利用Python对心脏病数据集进行分析,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。我们都很害怕生病,但感冒发烧这种从小到大的疾病我们已经麻木了,因为一星期他...
    99+
    2023-06-16
  • 怎么用Python进行系统聚类分析
    怎么用Python进行系统聚类分析,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。在进行机器学习时,我们往往要对数据进行聚类分析,聚类,说白了就是把相似的样品点/...
    99+
    2023-06-16
  • Python怎么使用Pandas进行数据分析
    首先,确保您已经安装了Pandas库。如果没有,请使用以下命令安装:pip install pandas一. 导入Pandas库import pandas as pd二. 读取数据使用Pandas,可以方便地读取多种数据格式,包括CSV、E...
    99+
    2023-05-16
    Python Pandas
  • 怎么利用Python对500强排行榜数据进行可视化分析
    今天小编给大家分享一下怎么利用Python对500强排行榜数据进行可视化分析的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。一...
    99+
    2023-06-30
  • 使用Python进行数据分析——方差分析
    大家好,方差分析可以用来判断几组观察到的数据或者处理的结果是否存在显著差异。本文介绍的方差分析(Analysis of Variance,简称ANOVA)就是用于检验两组或者两组以上样本的均值是否具备显著性差异的一种数理统计方法。 根据影...
    99+
    2023-09-12
    数据分析 数据挖掘 信息可视化 Powered by 金山文档
  • 怎么在Java中利用Kafka对客户端进行访问
    这篇文章给大家介绍怎么在Java中利用Kafka对客户端进行访问,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。1. maven依赖包<dependency> <groupId>org.apac...
    99+
    2023-05-31
    kafka java ava
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作