广告
返回顶部
首页 > 资讯 > 后端开发 > 其他教程 >R语言实现对数据框按某一列分组求组内平均值
  • 675
分享到

R语言实现对数据框按某一列分组求组内平均值

2024-04-02 19:04:59 675人浏览 薄情痞子
摘要

可使用aggregate函数 如: aggregate(.~ID,data=这个数据框名字,mean) 如果是对数据框分组,组内有重复的项,对于重复项保留最后一行数据用:

可使用aggregate函数

如:


aggregate(.~ID,data=这个数据框名字,mean) 

如果是对数据框分组,组内有重复的项,对于重复项保留最后一行数据用:


pcm_df$duplicated <- duplicated(paste(pcm_df$OUT_MAT_NO, pcm_df$Posit, sep = "_"), fromLast = TRUE)
pcm_df <- subset(pcm_df, !duplicated)
pcm_df$duplicated <- NULL

补充:R语言分组求和,分组求平均值,分组计数

我们经常可能需要把一个数据按照某一属性分组,然后计算一些统计值。在R语言里面,aggregate函数就可以办到。


## S3 method for class 'data.frame'
aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE)

我们常用到的参数是:x, by, FUN。

x, 你想要计算的属性或者列。

by, 是一个list,可以指定一个或者多个列作为分组的基础。

FUN, 指定一个函数,用来计算,可以作用在所有分组的数据上面。

假如这个是我们的数据。


type<-c("a","b","c","a","c","d","b","a","c","b")
value<-c(53,15,8,99,76,22,46,56,34,54)
df<-data.frame(type,value)
df
  type value
1   a  53
2   b  15
3   c   8
4   a  99
5   c  76
6   d  22
7   b  46
8   a  56
9   c  34
10  b  54

分组求和


 aggregate(df$value, by=list(type=df$type),sum)
 type  x
1  a 208
2  b 115
3  c 118
4  d 22

分组求平均值

分组求平均很简单,只要将上面的sum改成mean就可以了。


aggregate(df$value, by=list(type=df$type),mean)
 type    x
1  a 69.33333
2  b 38.33333
3  c 39.33333
4  d 22.00000

分组计数

分组计数就是在分组的情况下统计rows的数目。


aggregate(df$value, by=list(type=df$type),length)
 type x
1  a 3
2  b 3
3  c 3
4  d 1

基于多个属性分组求和。

我们在原有的数据上加上一列,可以看看多属性分组。


type_2 <-c("F","M","M","F","F","M","M","F","M","M")
df <- data.frame(df, type_2)
df
  type value type_2
1   a  53   F
2   b  15   M
3   c   8   M
4   a  99   F
5   c  76   F
6   d  22   M
7   b  46   M
8   a  56   F
9   c  34   M
10  b  54   M


aggregate(x=df$value, by=list(df$type,df$type_2),sum)
 Group.1 Group.2  x
1    a    F 208
2    c    F 76
3    b    M 115
4    c    M 42
5    d    M 22

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。如有错误或未考虑完全的地方,望不吝赐教。

--结束END--

本文标题: R语言实现对数据框按某一列分组求组内平均值

本文链接: https://www.lsjlt.com/news/121798.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • R语言实现对数据框按某一列分组求组内平均值
    可使用aggregate函数 如: aggregate(.~ID,data=这个数据框名字,mean) 如果是对数据框分组,组内有重复的项,对于重复项保留最后一行数据用: ...
    99+
    2022-11-11
  • R语言怎样实现对数据框按某一列分组求组内平均值
    小编给大家分享一下R语言怎样实现对数据框按某一列分组求组内平均值,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!可使用aggregate函数如:aggregate(...
    99+
    2023-06-14
  • R语言怎么按照某一列分组求均值
    小编给大家分享一下R语言怎么按照某一列分组求均值,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和...
    99+
    2023-06-14
  • R语言-如何按照某一列分组求均值
    主要介绍tapply函数: 每次只能求一列 aggregate函数:每次按组可以求多列 tapply(shuju[shuju[,3],shuju$year,mean) 以年份为...
    99+
    2022-11-12
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作