iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > 其他教程 >R语言交叉验证的实现代码
  • 586
分享到

R语言交叉验证的实现代码

2024-04-02 19:04:59 586人浏览 薄情痞子
摘要

k-折交叉验证 k-折交叉验证(K-fold cross-validation)是交叉验证方法里一种。它是指将样本集分为k份,其中k-1份作为训练数据集,而另外的1份作为验证数据集。

k-折交叉验证

k-折交叉验证(K-fold cross-validation)是交叉验证方法里一种。它是指将样本集分为k份,其中k-1份作为训练数据集,而另外的1份作为验证数据集。用验证集来验证所得分类器或者模型的错误率。一般需要循环k次,直到所有k份数据全部被选择一遍为止。

有关交叉验证的介绍可参考作者另一博文:
Http://blog.csdn.net/yawei_liu1688/article/details/79138202

R语言实现

K折交叉验证,随机分组

数据打折-数据分组自编译函数:进行交叉检验首先要对数据分组,数据分组要符合随机且平均的原则


library(plyr)
CVgroup <- function(k,datasize,seed){
 cvlist <- list()
 set.seed(seed)
 n <- rep(1:k,ceiling(datasize/k))[1:datasize]  #将数据分成K份,并生成的完成数据集n
 temp <- sample(n,datasize)  #把n打乱
 x <- 1:k
 dataseq <- 1:datasize
 cvlist <- lapply(x,function(x) dataseq[temp==x]) #dataseq中随机生成k个随机有序数据列
 return(cvlist)
}

k <- 10
datasize <- nrow(iris)
cvlist <- CVgroup(k = k,datasize = datasize,seed = 1206)
cvlist

结果输出示例:

输出示例

K折交叉验证
第一种方法:循环语句写验证


data <- iris
pred <- data.frame()  #存储预测结果
library(plyr)
library(randomForest)
m <- seq(60,500,by = 20) #如果数据量大尽量间隔大点,间隔过小没有实际意义
for(j in m){  #j指的是随机森林的数量
 progress.bar <- create_progress_bar("text") #plyr包中的create_progress_bar函数创建一个进度条,
 progress.bar$init(k)  #设置上面的任务数,几折就是几个任务
 for (i in 1:k){
  train <- data[-cvlist[[i]],] #刚才通过cvgroup生成的函数
  test <- data[cvlist[[i]],]
  model <-randomForest(Sepal.Length~.,data = train,ntree = j)  #建模,ntree=j 指的树数
  prediction <- predict(model,subset(test,select = -Sepal.Length))  #预测
  randomtree <- rep(j,length(prediction))  #随机森林树的数量
  kcross <- rep(i,length(prediction))  #i是第几次循环交叉,共K次
  temp <- data.frame(cbind(subset(test,select = Sepal.Length),prediction,randomtree,kcross))#真实值、预测值、随机森林树数、预测组编号捆绑在一起组成新的数据框tenp
  pred <- rbind(pred,temp)  #temp按行和pred合并
  print(paste("随机森林:",j)) #循环至树数j的随机森林模型
  progress.bar$step() #输出进度条。告知完成了这个任务的百分之几
 }
}

结果输出示例1:

输出示例

结果输出示例2:指标分别为真实值、预测值、随机森林树数、预测组编号

这里写图片描述

第二种方法:apply家族lapply
当测试的循环数较多或单任务耗时较多时,apply家族优势特别明显


data <- iris
library(plyr)
library(randomForest)
k = 10
j <- seq(10,10000,by = 20)  #j树的数量
i <- 1:k  #K折
i <- rep(i,times = length(j))
j <- rep(j,each = k)  #多少折,each多少
x <- cbind(i,j)
cvtest <- function(i,j){
 train <- data[-cvlist[[i]],]
 test <- data[cvlist[[i]],]
 model <- randomForest(Sepal.Length~.,data = train,ntree = j)
 prediction <- predict(model,subset(test,select = -Sepal.Length))
 temp <- data.frame(cbind(subset(test,select = Sepal.Length),prediction))
}

结果输出示例3:指标分别为真实值、预测值、随机森林树数、预测组编号

这里写图片描述


system.time(pred <- mdply(x,cvtest))  

这里写图片描述

mdyly在plyr包中:输出三个指标:“用户”“系统”“流逝”。其中“流逝”应该是这段代码从开始到结束的真正时间。对于一般单线程的程序来说这个时间近似于用户时间和系统时间之和,可以看出共运行了1386秒。

到此这篇关于R语言交叉验证的文章就介绍到这了,更多相关R语言交叉验证的实现代码内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: R语言交叉验证的实现代码

本文链接: https://www.lsjlt.com/news/121414.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • R语言交叉验证的实现代码
    k-折交叉验证 k-折交叉验证(K-fold cross-validation)是交叉验证方法里一种。它是指将样本集分为k份,其中k-1份作为训练数据集,而另外的1份作为验证数据集。...
    99+
    2024-04-02
  • R语言逻辑回归、ROC曲线与十折如何实现交叉验证
    本篇内容主要讲解“R语言逻辑回归、ROC曲线与十折如何实现交叉验证”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“R语言逻辑回归、ROC曲线与十折如何实现交叉验证”吧!1. 测试集和训练集3、7分...
    99+
    2023-06-08
  • python实现K折交叉验证
    本文实例为大家分享了python实现K折交叉验证的具体代码,供大家参考,具体内容如下 用KNN算法训练iris数据,并使用K折交叉验证方法找出最优的K值 import numpy...
    99+
    2024-04-02
  • R语言逻辑回归、ROC曲线与十折交叉验证详解
    自己整理编写的逻辑回归模板,作为学习笔记记录分享。数据集用的是14个自变量Xi,一个因变量Y的australian数据集。 1. 测试集和训练集3、7分组 australian ...
    99+
    2024-04-02
  • C++实现验证二叉搜索树代码
    本篇内容主要讲解“C++实现验证二叉搜索树代码”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“C++实现验证二叉搜索树代码”吧!验证二叉搜索树Given a binary tree, determ...
    99+
    2023-06-20
  • python留一交叉验证的实例
    目录python 留一交叉验证基本原理代码实现留一法交叉验证 Leave-One-Out Cross Validation我们用SKlearn库来实现一下LOOpython 留一交叉...
    99+
    2024-04-02
  • R语言实现岭回归的示例代码
    岭参数的一般选择原则 选择k(或lambda)值,使得: 各回归系数的岭估计基本稳定 用最小二乘估计时符号不合理的回归系数,其岭回归的符号变得合理 ...
    99+
    2024-04-02
  • 用R语言实现霍夫曼编码的示例代码
    可读性极低,而且其实也没必要用R语言写,图个乐罢了  p=c(0.4,0.2,0.2,0.1,0.1)###输入形如c(0.4,0.2,0.2,0.1,0.1)的概率向...
    99+
    2024-04-02
  • java登录验证码实现代码
    VerifyCodeServlet.java类:复制代码 代码如下:package com.spring.controller;import java.awt.Color; ...
    99+
    2022-11-15
    java 验证码
  • R语言-如何实现卡方检验
    卡方检验 在数据统计中,卡方检验是一种很重要的方法。 通常卡方检验的应用主要为: 1、 卡方拟合优度检验 2、卡方独立性检验 本文主要通过使用自己编程的方法实现相关检验。 卡方拟合优...
    99+
    2024-04-02
  • Ajax登录验证实现代码
    目录 package cn.hp.util; import java.sql.*; public class JDBCUtils { static Connection c...
    99+
    2024-04-02
  • 怎么在R语言中实现验证及协方差的计算公式
    怎么在R语言中实现验证及协方差的计算公式?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。首先附上协方差公式:来设5个样本点:(3,9),(2,7),(4,12),(5,15)...
    99+
    2023-06-15
  • R语言验证及协方差的计算公式
    协方差的计算公式及R语言进行验证 首先附上协方差公式: 来设5个样本点:(3,9),(2,7),(4,12),(5,15),(6,17) 用R绘制出散点图,大概是这样: 要求这5...
    99+
    2024-04-02
  • 交叉验证之KFold和StratifiedKFold的使用(附案例实战)
    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬...
    99+
    2023-08-31
    python 机器学习 决策树 数据挖掘
  • Java实现短信验证码的示例代码
    目录项目需求需求来由代码实现发送验证码方法注册方法忘记密码前端代码编码中遇到的问题如何改进短信验证码相信大家都不陌生吗,但是短信验证码怎么生成的你真的了解吗,本文揭示本人项目中对短信...
    99+
    2024-04-02
  • Java实现滑动验证码的示例代码
    目录1.效果演示2.后端代码控制层工具类3.前端页面功能:java实现滑动验证码 项目是采用springboot,maven 开发工具:采用idea 1.效果演示 2.后端代码...
    99+
    2024-04-02
  • Ajax实现邮箱验证实例代码
    html代码: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF...
    99+
    2024-04-02
  • R语言绘制饼状图代码实例
    R编程语言有许多库来创建图表和图表。 饼图是将值表示为具有不同颜色的圆的切片。 切片被标记,并且对应于每个片的数字也在图表中表示。 在R语言中,饼图是使用pie()函数创建的,它使用...
    99+
    2024-04-02
  • SpringAOP实现登录验证的操作代码
    要求任何操作都建立在已经登录的基础上,登录操作除外。。。。 使用Spring AOP不仅简单,还不会对其他部件中产生影响 以下具体代码实现: package com.joey.uti...
    99+
    2024-04-02
  • R语言实现PCA主成分分析图的示例代码
    目录简介开始作图1. PCA 分析图本质上是散点图2. 为不同类别着色3. 样式微调简介 主成分分析(Principal Component Analysis,PCA)是一种无监督的...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作