iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > 其他教程 >R语言关于随机森林算法的知识点详解
  • 635
分享到

R语言关于随机森林算法的知识点详解

2024-04-02 19:04:59 635人浏览 泡泡鱼
摘要

在随机森林方法中,创建大量的决策树。 每个观察被馈入每个决策树。 每个观察的最常见的结果被用作最终输出。 新的观察结果被馈入所有的树并且对每个分类模型取多数投票。 对构建树时未使用的

在随机森林方法中,创建大量的决策树。 每个观察被馈入每个决策树。 每个观察的最常见的结果被用作最终输出。 新的观察结果被馈入所有的树并且对每个分类模型取多数投票。

对构建树时未使用的情况进行错误估计。 这称为OOB(袋外)误差估计,其被提及为百分比。

R语言包“randomForest”用于创建随机森林。

安装R包

在R语言控制台中使用以下命令安装软件包。 您还必须安装相关软件包(如果有)。


install.packages("randomForest")

包“randomForest”具有函数randomForest(),用于创建和分析随机森林。

语法

在R语言中创建随机森林的基本语法是


randomForest(fORMula, data)

以下是所使用的参数的描述 

  • formula是描述预测变量和响应变量的公式。
  • data是所使用的数据集的名称。

输入数据

我们将使用名为readingSkills的R语言内置数据集来创建决策树。 它描述了某人的readingSkills的分数,如果我们知道变量“age”,“shoesize”,“score”,以及该人是否是母语。

以下是示例数据。


# Load the party package. It will automatically load other required packages.
library(party)

# Print some records from data set readingSkills.
print(head(readingSkills))

当我们执行上面的代码,它产生以下结果及图表


  nativeSpeaker   age   shoeSize      score
1           yes     5   24.83189   32.29385
2           yes     6   25.95238   36.63105
3            no    11   30.42170   49.60593
4           yes     7   28.66450   40.28456
5           yes    11   31.88207   55.46085
6           yes    10   30.07843   52.83124
Loading required package: methods
Loading required package: grid
...............................
...............................

我们将使用randomForest()函数来创建决策树并查看它的图。


# Load the party package. It will automatically load other required packages.
library(party)
library(randomForest)

# Create the forest.
output.forest <- randomForest(nativeSpeaker ~ age + shoeSize + score, 
           data = readingSkills)

# View the forest results.
print(output.forest) 

# Importance of each predictor.
print(importance(fit,type = 2)) 

当我们执行上面的代码,它产生以下结果


Call:
 randomForest(formula = nativeSpeaker ~ age + shoeSize + score,     
                 data = readingSkills)
               Type of random forest: classification
                     Number of trees: 500
No. of variables tried at each split: 1

        OOB estimate of  error rate: 1%
Confusion matrix:
    no yes class.error
no  99   1        0.01
yes  1  99        0.01
         MeanDecreaseGini
age              13.95406
shoeSize         18.91006
score            56.73051

结论

从上面显示的随机森林,我们可以得出结论,鞋码和成绩是决定如果某人是母语者或不是母语的重要因素。 此外,该模型只有1%的误差,这意味着我们可以预测精度为99%。

到此这篇关于R语言关于随机森林算法的知识点详解的文章就介绍到这了,更多相关R语言随机森林算法内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: R语言关于随机森林算法的知识点详解

本文链接: https://www.lsjlt.com/news/125769.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • R语言关于随机森林算法的知识点详解
    在随机森林方法中,创建大量的决策树。 每个观察被馈入每个决策树。 每个观察的最常见的结果被用作最终输出。 新的观察结果被馈入所有的树并且对每个分类模型取多数投票。 对构建树时未使用的...
    99+
    2024-04-02
  • R语言中怎么实现随机森林算法
    在R语言中,您可以使用 randomForest 包来实现随机森林算法。以下是一个简单的示例代码,演示如何在R中使用随机森林算法进行...
    99+
    2024-04-03
    R语言
  • R语言实现随机森林的方法示例
    目录随机森林算法介绍算法介绍:决策树生长步骤:投票过程:基本思想:随机森林的优点:缺点R语言实现随机森林模型搭建1:randomForest()函数用于构建随机森林模型2:impor...
    99+
    2024-04-02
  • 使用R语言怎么实现一个随机森林算法
    这篇文章给大家介绍使用R语言怎么实现一个随机森林算法,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。R语言包“randomForest”用于创建随机森林。安装R包在R语言控制台中使用以下命令安装软件包。 您还必须安装相关...
    99+
    2023-06-15
  • 基于随机森林算法的森林生物量反演【Matlab Python】
    一、意义以及技术路线   估算森林生物量的方法大致可归为以下两种 :一是传统估算方法,大多是采用抽样方法获取野外调查数据估算森林生物量,这种方法往往需要较多的人力物力来完成,并且获取的数据不具有空间连续性特征,无法反映环境因子对估算结果的影...
    99+
    2023-09-28
    随机森林 算法 机器学习 python matlab
  • R语言关于数据帧的知识点详解
    数据帧是表或二维阵列状结构,其中每一列包含一个变量的值,并且每一行包含来自每一列的一组值。 以下是数据帧的特性。 列名称应为非空。 行名称应该是唯一的。 存...
    99+
    2024-04-02
  • R语言关于“包”的知识点总结
    R语言的包是R函数,编译代码和样本数据的集合。 它们存储在R语言环境中名为“library”的目录下。 默认情况下,R语言在安装期间安装一组软件包。 随后添加更多包,当它们用于某些特...
    99+
    2024-04-02
  • python人工智能算法之随机森林流程详解
    目录随机森林优缺点总结随机森林 (Random Forest)是一种基于决策树(前文有所讲解)的集成学习算法,它能够处理分类和回归两类问题。 随机森林的基本思想是通过随机选择样本和...
    99+
    2023-03-21
    python 人工智能算法随机森林 python 人工智能
  • R语言关于变量的知识点总结
    变量为我们提供了我们的程序可以操作的命名存储。 R语言中的变量可以存储原子向量,原子向量组或许多Robject的组合。 有效的变量名称由字母,数字和点或下划线字符组成。 变量名以字母...
    99+
    2024-04-02
  • R语言中因子相关知识点详解
    因子是用于对数据进行分类并将其存储为级别的数据对象。 它们可以存储字符串和整数。 它们在具有有限数量的唯一值的列中很有用。 像“男性”,“女性”和True,False等。它们在统计建...
    99+
    2024-04-02
  • R语言“循环”知识点详解
    可能有一种情况,当你需要执行一段代码几次。 通常,顺序执行语句。 首先执行函数中的第一个语句,然后执行第二个语句,依此类推。 编程语言提供允许更复杂的执行路径的各种控制结构。 循环语...
    99+
    2024-04-02
  • R语言运算符知识点讲解
    运算符 运算符:包含一个或者两个参数的无括号的参数 符号 说明 + ...
    99+
    2024-04-02
  • R语言关于决策树知识点总结
    决策树是以树的形式表示选择及其结果的图。图中的节点表示事件或选择,并且图的边缘表示决策规则或条件。它主要用于使用R的机器学习和数据挖掘应用程序。 决策树的使用的例子是 预测电子邮件是...
    99+
    2024-04-02
  • R语言关于二项分布知识点总结
    二项分布模型处理在一系列实验中仅发现两个可能结果的事件的成功概率。 例如,掷硬币总是给出头或尾。 在二项分布期间估计在10次重复抛掷硬币中精确找到3个头的概率。 R语言有四个内置函数...
    99+
    2024-04-02
  • R语言关于多重回归知识点总结
    多元回归是线性回归到两个以上变量之间的关系的延伸。 在简单线性关系中,我们有一个预测变量和一个响应变量,但在多元回归中,我们有多个预测变量和一个响应变量。 多元回归的一般数学方程为 ...
    99+
    2024-04-02
  • R语言关于泊松回归知识点总结
    泊松回归(英语:Poisson regression)包括回归模型,其中响应变量是计数而不是分数的形式。  例如,足球比赛系列中的出生次数或胜利次数。 此外,响应变量的值遵...
    99+
    2024-04-02
  • R语言关于生存分析知识点总结
    生存分析处理预测特定事件将要发生的时间。 它也被称为故障时间分析或分析死亡时间。 例如,预测患有癌症的人将存活的天数或预测机械系统将失败的时间。 命名为survival的R语言包用于...
    99+
    2024-04-02
  • Matlab利用随机森林(RF)算法实现回归预测详解
    目录1 分解代码1.1 最优叶子节点数与树数确定1.2 循环准备1.3 数据划分1.4 随机森林实现1.5 精度衡量1.6 变量重要程度排序1.7 保存模型2 完整代码本文分为两部分...
    99+
    2023-02-17
    Matlab随机森林 回归预测 Matlab 回归预测 Matlab随机森林
  • R语言中循环的相关知识详解
    目录repeatwhile向量for循环break和nextrepeat repeat是最存粹的循环,只要不让出来,就一直重复{}中的代码,可以在命令行中输入 repeat{prin...
    99+
    2023-03-19
    R语言 循环使用 R语言 循环
  • R语言决策基础知识点详解
    决策结构要求程序员指定要由程序评估或测试的一个或多个条件,以及如果条件被确定为真则要执行的一个或多个语句,如果条件为假则执行其他语句。 以下是在大多数编程语言中的典型决策结构的一般形...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作