iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > 其他教程 >R语言-summary()函数的用法解读
  • 638
分享到

R语言-summary()函数的用法解读

2024-04-02 19:04:59 638人浏览 薄情痞子
摘要

summary():获取描述性统计量,可以提供最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计等。 结果解读如下: 1. 调用:Call lm(f

summary():获取描述性统计量,可以提供最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计等。

结果解读如下:

1. 调用:Call


lm(fORMula = DstValue ~ Month + RecentVal1 + RecentVal4 + RecentVal6 + RecentVal8 + RecentVal12, data = trainData)

当创建模型时,以上代码表明lm是如何被调用的。

2. 残差统计量:Residuals


             Min           1Q        Median         3Q         Max 
          -4806.5    -1549.1     -171.8      1368.7     6763.3 

残差第一四分位数(1Q)和第三分位数(Q3)有大约相同的幅度,意味着有较对称的钟形分布。

3. 系数:Coefficients


                                Estimate     Std. Error       t value     Pr(>|t|)    
       (Intercept)      1.345e+06    5.659e+05     2.377     0.01879 *  
       Month             8.941e+02    2.072e+02    4.316     3.00e-05 ***

分别表示: 估值 标准误差 T值 P值

Intercept:表示截距

Month:影响因子/特征

Estimate的列:包含由普通最小二乘法计算出来的估计回归系数。

Std. Error的列:估计的回归系数的标准误差。

P值估计系数不显著的可能性,有较大P值的变量是可以从模型中移除的候选变量。

t 统计量和P值:从理论上说,如果一个变量的系数是0,那么该变量是无意义的,它对模型毫无贡献。

然而,这里显示的系数只是估计,它们不会正好为0。

因此,我们不禁会问:从统计的角度而言,真正的系数为0的可能性有多大?这是t统计量和P值的目的,在汇总中被标记为t value和Pr(>|t|)。

其 中,我们可以直接通过P值与我们预设的0.05进行比较,来判定对应的解释变量的显著性,我们检验的原假设是:该系数显著为0;若P<0.05,则拒绝原假设,即对应的变量显著不为0。

可以看到Month、RecentVal4、RecentVal8都可以认为是在P为0.05的水平下显著不为0,通过显著性检验;Intercept的P值为0.26714,不显著。

4. Multiple R-squared和Adjusted R-squared

这两个值,即R^{2},常称之为“拟合优度”和“修正的拟合优度”,指回归方程对样本的拟合程度几何,这里我们可以看到,修正的拟合优 度=0.8416,表示拟合程度良好,这个值当然是越高越好。

当然,提升拟合优度的方法很多,当达到某个程度,我们也就认为差不多了。

具体还有很复杂的判定内容,有兴趣的可以看看:Http://baike.baidu.com/view/657906.htm

5. F-statistic

F-statistic,是我们常说的F统计量,也成为F检验,常常用于判断方程整体的显著性检验,其值越大越显著;其P值为p-value: < 2.2e-16,显然是<0.05的,可以认为方程在P=0.05的水平上还是通过显著性检验的。

简单总结

T检验:检验解释变量的显著性;

R-squared:查看方程拟合程度;

F检验:是检验方程整体显著性。

如果是一元线性回归方程,T检验的值和F检验的检验效果是一样的,对应的值也是相同的。

补充:在R语言中显示美丽的数据摘要summary统计信息

总结数据集


## Skim summary statistics
##  n obs: 150 
##  n variables: 5 
## 
## Variable type: factor 
##   variable missing complete   n n_unique                       top_counts
## 1  Species       0      150 150        3 set: 50, ver: 50, vir: 50, NA: 0
##   ordered
## 1   FALSE
## 
## Variable type: numeric 
##       variable missing complete   n mean   sd min p25 median p75 max
## 1 Petal.Length       0      150 150 3.76 1.77 1   1.6   4.35 5.1 6.9
## 2  Petal.Width       0      150 150 1.2  0.76 0.1 0.3   1.3  1.8 2.5
## 3 Sepal.Length       0      150 150 5.84 0.83 4.3 5.1   5.8  6.4 7.9
## 4  Sepal.Width       0      150 150 3.06 0.44 2   2.8   3    3.3 4.4
##       hist
## 1 ▇▁▁▂▅▅▃▁
## 2 ▇▁▁▅▃▃▂▂
## 3 ▂▇▅▇▆▅▂▂
## 4 ▁▂▅▇▃▂▁▁

选择要汇总的特定列


## Skim summary statistics
##  n obs: 150 
##  n variables: 5 
## 
## Variable type: numeric 
##       variable missing complete   n mean   sd min p25 median p75 max
## 1 Petal.Length       0      150 150 3.76 1.77 1   1.6   4.35 5.1 6.9
## 2 Sepal.Length       0      150 150 5.84 0.83 4.3 5.1   5.8  6.4 7.9
##       hist
## 1 ▇▁▁▂▅▅▃▁
## 2 ▂▇▅▇▆▅▂▂

处理分组数据

可以处理已使用分组的数据dplyr::group_by。


## Skim summary statistics
##  n obs: 150 
##  n variables: 5 
##  group variables: Species 
## 
## Variable type: numeric 
##       Species     variable missing complete  n mean   sd min  p25 median
## 1      setosa Petal.Length       0       50 50 1.46 0.17 1   1.4    1.5 
## 2      setosa  Petal.Width       0       50 50 0.25 0.11 0.1 0.2    0.2 
## 3      setosa Sepal.Length       0       50 50 5.01 0.35 4.3 4.8    5   
## 4      setosa  Sepal.Width       0       50 50 3.43 0.38 2.3 3.2    3.4 
## 5  versicolor Petal.Length       0       50 50 4.26 0.47 3   4      4.35
## 6  versicolor  Petal.Width       0       50 50 1.33 0.2  1   1.2    1.3 
## 7  versicolor Sepal.Length       0       50 50 5.94 0.52 4.9 5.6    5.9 
## 8  versicolor  Sepal.Width       0       50 50 2.77 0.31 2   2.52   2.8 
## 9   virginica Petal.Length       0       50 50 5.55 0.55 4.5 5.1    5.55
## 10  virginica  Petal.Width       0       50 50 2.03 0.27 1.4 1.8    2   
## 11  virginica Sepal.Length       0       50 50 6.59 0.64 4.9 6.23   6.5 
## 12  virginica  Sepal.Width       0       50 50 2.97 0.32 2.2 2.8    3   
##     p75 max     hist
## 1  1.58 1.9 ▁▁▅▇▇▅▂▁
## 2  0.3  0.6 ▂▇▁▂▂▁▁▁
## 3  5.2  5.8 ▂▃▅▇▇▃▁▂
## 4  3.68 4.4 ▁▁▃▅▇▃▂▁
## 5  4.6  5.1 ▁▃▂▆▆▇▇▃
## 6  1.5  1.8 ▆▃▇▅▆▂▁▁
## 7  6.3  7   ▃▂▇▇▇▃▅▂
## 8  3    3.4 ▁▂▃▅▃▇▃▁
## 9  5.88 6.9 ▂▇▃▇▅▂▁▂
## 10 2.3  2.5 ▂▁▇▃▃▆▅▃
## 11 6.9  7.9 ▁▁▃▇▅▃▂▃
## 12 3.18 3.8 ▁▃▇▇▅▃▁▂

指定统计信息和类

可以用户使用与该skim_with()功能组合的列表来指定自己的统计信息。


## Skim summary statistics
##  n obs: 150 
##  n variables: 5 
## 
## Variable type: numeric 
##       variable iqr  mad
## 1 Sepal.Length 1.3 1.04

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。如有错误或未考虑完全的地方,望不吝赐教。

--结束END--

本文标题: R语言-summary()函数的用法解读

本文链接: https://www.lsjlt.com/news/124189.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • R语言-summary()函数的用法解读
    summary():获取描述性统计量,可以提供最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计等。 结果解读如下: 1. 调用:Call lm(f...
    99+
    2024-04-02
  • 怎么在R语言中使用summary()函数
    本篇文章为大家展示了怎么在R语言中使用summary()函数,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于GNU系统的一个自由、免费、源代...
    99+
    2023-06-14
  • R语言中xtabs函数的用法
    这篇文章将为大家详细讲解有关R语言中xtabs函数的用法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。今天在做一个列联表独立性检验的时候,总是无法处理好要求的数据类型,偶然的机会,看到了xtabs()函数...
    99+
    2023-06-14
  • R语言函数详解及实例用法
    函数是一组组合在一起以执行特定任务的语句。 R 语言具有大量内置函数,用户可以创建自己的函数。 在R语言中,函数是一个对象,因此R语言解释器能够将控制传递给函数,以及函数完成动作所需...
    99+
    2024-04-02
  • R语言strsplit函数用法深入详解
    1、R语言strsplit用于分割字符串 创建测试数据 > test <- "aa bb cc dd ee ff" ##创建测试数据 > test [1] "a...
    99+
    2024-04-02
  • R语言seq()函数的调用方法
    看到有很多读者浏览了这篇文章,心里很是开心,为了能够更好地帮助大家,决定再修改一下,帮助大家更好地理解。 --------修改于:2018年4月28日 为了方便大家在开发环境中直接实...
    99+
    2024-04-02
  • R语言中assign函数和get函数的用法
    assign函数在循环时候,给变量赋值,算是比较方便 1、给变量赋值 for (i in 1:(length(rowSeq)-1)){ assign(paste("nginx...
    99+
    2024-04-02
  • R语言中qplot()函数的用法说明
    ggplot2()函数 ggplot2是一个强大的作图工具,它可以让你不受现有图形类型的限制,创造出任何有助于解决你所遇到问题的图形。 qplot() qplot()属于ggplot...
    99+
    2024-04-02
  • R语言中cut()函数的用法说明
    R语言cut()函数使用 cut()切割将x的范围划分为时间间隔,并根据其所处的时间间隔对x中的值进行编码。 参数:breaks:两个或更多个唯一切割点或单个数字(大于或等于2)的数...
    99+
    2024-04-02
  • r语言signif函数的用法是什么
    在R语言中,signif函数用于对一个数进行四舍五入,并指定保留的有效数字位数。其语法如下: signif(x, digits) ...
    99+
    2024-03-06
    r语言
  • r语言sink函数的用法是什么
    在R语言中,sink()函数用于重定向输出,将控制台上的输出写入到文件中。它有两种常用的用法: 将控制台上的输出写入到文件中: ...
    99+
    2024-03-06
    r语言
  • R语言中quantile()函数的用法说明
    在R语言中取百分位比用quantile()函数,下面举几个简单的示例: 1、求某个百分位比 > data <- c(1,2,3,4,5,6,7,8,9,10) >...
    99+
    2024-04-02
  • R语言 title()函数的参数用法说明
    如下所示: title(main = NULL, sub = NULL, xlab = NULL, ylab = NULL, line = NA, outer = FALS...
    99+
    2024-04-02
  • R语言中set.seed()函数的作用详解
    目录001、首先查看不使用set.seed函数的情况002、使用set.seed函数的情况003、改变种子序号的情况R语言中set.seed()函数的作用是保证前后生成的随机数保持一...
    99+
    2024-04-02
  • R语言中aggregate 函数详解
    目录R语言中aggregate 函数001、测试数据框002、 调用函数R语言中aggregate 函数 aggregate函数是数据处理中常用到的函数,具有强大的功能。可以按照要求...
    99+
    2023-05-17
    R语言aggregate 函数 aggregate 函数
  • R语言中merge函数详解
    1、创建测试数据: name <- c('A','B','A','A','C','D') school <- c('s1','s2','s1','s1','s1','...
    99+
    2024-04-02
  • 聊聊R语言中Legend 函数的参数用法
    如下所示: legend(x, y = NULL, legend, fill = NULL, col = par("col"), border = "black", lty, l...
    99+
    2024-04-02
  • R语言的xtabs函数实例讲解
    今天在做一个列联表独立性检验的时候,总是无法处理好要求的数据类型,偶然的机会,看到了xtabs()函数,感觉很适合用来做列联表,适合将一列数据转换成列联表。 shifou <...
    99+
    2024-04-02
  • R语言中的fivenum与quantile()函数算法详解
    fivenum()函数: 返回五个数据:最小值、下四分位数数、中位数、上四分位数、最大值 对于奇数个数字=5,fivenum()先排序,依次返回最小值、下四分位数、中位数、上四分位数...
    99+
    2024-04-02
  • 详解R语言caret包trainControl函数
    目录trainControl参数详解源码参数详解示例trainControl参数详解 源码 caret::trainControl <- function (method =...
    99+
    2022-11-13
    R语言caret包trainControl函数 R语言caret包
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作