Python 官方文档:入门教程 => 点击学习
T检验通常分为三种:单样本T检验、双样本T检验、配对样本T检验原理可以参考:一文详解t检验本文主要介绍使用python实现T检验的过程,内容主要是参考这篇博文:利用python库stats进行t检验
目的:检验单样本的均值是否和已知总体的均值相等
前提条件:
(1)总体方差未知,否则就可以利用 Z Z Z 检验(也叫 U U U 检验,就是正态检验);
(2)正态数据或近似正态;
(3)连续变量
原假设和备择假设:
H 0 : 样 本 均 值 ( X ‾ ) 和 总 体 均 值 ( μ ) 相 等 H 1 : 样 本 均 值 ( X ‾ ) 和 总 体 均 值 ( μ ) 不 相 等 \begin{aligned} & H_{0}: 样本均值(\overline{X})和总体均值( \mu )相等\\ & H_{1}: 样本均值(\overline{X})和总体均值( \mu )不相等 \end{aligned} H0:样本均值(X)和总体均值(μ)相等H1:样本均值(X)和总体均值(μ)不相等
例子:假设已知我国男青少年的平均身高是1.73,那么取某高校50名男生的身高(本文采用随机数据),想比较该高校与我国男青少年的平均身高是否存在差异。
ttest_1samp 函数参数可参考:Python scipy.stats.ttest_1samp实例讲解
from scipy import stats rvs = stats.nORM.rvs(loc=1.5, scale=1, size=(50)) # 生成均值为1.5,标准差为1的50个样本t, p = stats.ttest_1samp(rvs, 1.73) # 进行单样本T检验print(" T-test: %f\n"%t,"P-vlaue: %f"%p)# T-test: -3.087647# P-vlaue: 0.003317
结论:T值小于0,说明样本均值小于总体均值;P值小于0.05,说明该高校与我国男青少年的平均身高存在差异。
单侧检验 :scipy库中stats只提供了双侧检验,如果需要单侧检验只需要将计算出来的P值除于2即可,这里参考文章:利用python进行单边T检验
置信区间:采用 scipy.stats.norm.interval() 函数计算
import numpy as npstats.norm.interval( alpha = 0.95, loc = np.mean(rvs), scale = stats.sem(rvs))
场景1: 想比较可口可乐饮料在沃尔玛、大润发两个超市的销量是否存在差异
场景2: 想比较南、北方人的平均身高、体重是否存在差异
需要注意的是
:前期需要检验两组方差是否相等,如不相等, scipy.stats.ttest_ind() 函数中的参数 equal_var 需要设置成 False
from scipy import stats rvs_1 = stats.norm.rvs(loc=1.5, scale=1, size=(50)) # 生成均值为1.5,标准差为1的50个样本rvs_2 = stats.norm.rvs(loc=2, scale=1, size=(50)) # 生成均值为2,标准差为1的50个样本levene = stats.levene(rvs_1, rvs_2) # 进行 levene 检验t, p = stats.ttest_ind(rvs_1,rvs_2,equal_var=True) # 独立样本t检验print("levene 检验P值: %f"%levene.pvalue,'\n')print("独立样本t检验")print(" T-test: %f\n"%t,"P-vlaue: %f"%p)
场景1: 将小白鼠配对为两组,分别接受不同的处理,检验处理结果的差异
场景2: 对于一批血清样本,将其分为两个部分,利用不同的方法接受某种化合物的检验,检验结果的差异
场景3: 检验癌症患者术前、术后的某种指标的差异
场景4: 可口可乐饮料今年与去年在沃尔玛超市销售额均值是否存在差异
与独立样本t检验相比,配对样本T检验要求样本是配对的,两个样本的样本量要相同
python 实现有两种方式:
(1)两组数据做差,再对差值进行单样本T检验,检验均值为0;
(2)利用 scipy.stats.ttest_rel() 函数进行配对样本T检验
from scipy import stats rvs_1 = stats.norm.rvs(loc=1.5, scale=1, size=(50)) # 生成均值为1.5,标准差为1的50个样本rvs_2 = stats.norm.rvs(loc=2, scale=1, size=(50)) # 生成均值为2,标准差为1的50个样本levene = stats.levene(rvs_1, rvs_2) # 进行 levene 检验t1, p1 = stats.ttest_1samp(rvs_1 - rvs_2, 0) # 单样本T检验t2, p2 = stats.ttest_rel(rvs_1,rvs_2) # 配对样本t检验print("levene 检验P值: %f"%levene.pvalue,'\n')print("单样本T检验")print(" T-test: %f\n"%t1,"P-vlaue: %f"%p1)print("\n配对样本t检验")print(" T-test: %f\n"%t2,"P-vlaue: %f"%p2)
来源地址:https://blog.csdn.net/small__roc/article/details/128158800
--结束END--
本文标题: python T检验
本文链接: https://www.lsjlt.com/news/386221.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
下载Word文档到电脑,方便收藏和打印~
2024-03-01
2024-03-01
2024-03-01
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0