广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python验证多组数据之间有什么差异
  • 490
分享到

python验证多组数据之间有什么差异

2023-06-22 07:06:19 490人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍python验证多组数据之间有什么差异,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一、方差分析1.单因素方差分析通过箱线图可以人肉看出10组的订单量看起来差不多,为了更科学比较10组的订单量有无显著

这篇文章主要介绍python验证多组数据之间有什么差异,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

一、方差分析

1.单因素方差分析

python验证多组数据之间有什么差异

通过箱线图可以人肉看出10组的订单量看起来差不多,为了更科学比较10组的订单量有无显著差异,我们可以利用方差分析

from statsmodels.fORMula.api import olsfrom statsmodels.stats.anova import anova_lmmodel = ols('orders~C(label)',data=need_data).fit()anova_table = anova_lm(model, typ = 2)print(anova_table)

python验证多组数据之间有什么差异

结果显示,p值为0.62大于0.05,不能拒绝原假设,所以这10组的订单量分布没有显著差异。

二、卡方检验

如果是比较多组之间的非连续值指标是否存在差异呢?

如检查上面10组的男女比例是否存在显著差异

python验证多组数据之间有什么差异

计算各组观察频数:

data2=data1.melt(id_vars=['性别'],value_name='观察频数')data2.head()

python验证多组数据之间有什么差异

计算总体的男女比例:

rate=(data2.groupby(['性别'])['观察频数'].sum()/data2.groupby(['性别'])['观察频数'].sum().sum()).reset_index()rate.columns=['性别','rate']rate

python验证多组数据之间有什么差异

计算各组用户总数:

group_sum=data2.groupby(['组别'])['观察频数'].sum().reset_index()group_sum.columns=['组别','组内用户数']group_sum

python验证多组数据之间有什么差异

计算卡方值:

import mathdata3=pd.merge(data2,group_sum,on=['组别'],how='left')data3=pd.merge(data3,rate,on=['性别'],how='left')data3['期望频数']=data3['组内用户数']*data3['rate']data3['卡方值']=data3.apply(lambda x: math.pow((x.期望频数-x.观察频数),2)/x.期望频数,axis=1)data3.head()

python验证多组数据之间有什么差异

本案例的自由度为(10-1)*(2-1)=9,选取显著性水平为0.05,查卡方分布表得临界值为18.31
因为7.01<18.31,所以不能拒绝原假设,即各组的性别分布不存在显著性差异。

以上是“Python验证多组数据之间有什么差异”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注编程网Python频道!

--结束END--

本文标题: python验证多组数据之间有什么差异

本文链接: https://www.lsjlt.com/news/303344.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python验证多组数据之间有什么差异
    这篇文章主要介绍python验证多组数据之间有什么差异,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一、方差分析1.单因素方差分析通过箱线图可以人肉看出10组的订单量看起来差不多,为了更科学比较10组的订单量有无显著...
    99+
    2023-06-22
  • python验证多组数据之间有无显著差异
    目录一、方差分析1.单因素方差分析二、卡方检验一、方差分析 1.单因素方差分析 通过箱线图可以人肉看出10组的订单量看起来差不多,为了更科学比较10组的订单量有无显著差异,我们可以...
    99+
    2022-11-12
  • PHP数据类型和Git分布式之间有什么联系和差异?
    PHP是一种非常流行的服务器端脚本语言,而Git则是一种流行的版本控制工具。虽然它们的应用领域和功能不同,但它们有一些共同点和差异,本文将探讨它们之间的联系和差异。 数据类型 PHP有多种数据类型,包括整数、浮点数、字符串、数组、对象等等...
    99+
    2023-09-27
    数据类型 git 分布式
  • Python和Laravel中的数据类型之间有哪些差异?如何解决它们?
    Python和Laravel是两种非常流行的编程语言,它们都有自己的数据类型。但是,在某些情况下,这些数据类型之间存在差异。在本文中,我们将探讨Python和Laravel中的数据类型之间的差异,以及如何解决它们。 Python和Larav...
    99+
    2023-10-02
    laravel load 数据类型
  • JS中自定义react数据验证组件有什么用
    小编给大家分享一下JS中自定义react数据验证组件有什么用,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解...
    99+
    2022-10-19
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作