广告
返回顶部
首页 > 资讯 > 后端开发 > 其他教程 >R语言中Fisher判别的使用方法
  • 731
分享到

R语言中Fisher判别的使用方法

2024-04-02 19:04:59 731人浏览 独家记忆
摘要

最近编写了Fisher判别的相关代码时,需要与已有软件比照结果以确定自己代码的正确性,于是找到了安装方便且免费的R。这里把R中进行Fisher判别的方法记录下来。 1. 判别分析与F

最近编写了Fisher判别的相关代码时,需要与已有软件比照结果以确定自己代码的正确性,于是找到了安装方便且免费的R。这里把R中进行Fisher判别的方法记录下来。

1. 判别分析与Fisher判别

不严谨但是通俗的说法,判别分析(Discriminant Analysis)是一种多元(多个变量)统计分析方法,它根据样本的多个已知变量的值对样本进行分类的方法。一般来说,判别分析由两个阶段构成——学习(训练)和判别。在学习阶段,给定一批已经被分类好的样本,根据它们的分类情况和样本的多个变量的值来学习(训练)得到一种判别方法;在判别阶段用前一阶段得到的判别方法对其他样本进行判别。

Fisher判别(Fisher Discrimination Method)又被称为线性判别(LDA,Linear Discriminative Analysis),是判别分析的一种,历史可以追溯到1936年。它的核心思想是将多维数据(多个变量)投影(使用线性运算)到一维(单一变量)上,然后通过给定阈值将样本根据投影后的单一变量进行分类。

Fisher判别的学习(训练)阶段,就是找到合适的投影方式,使得对于已经被分类好的样本,同一类的样本被投影后尽量扎堆。学习阶段的结果是找到一系列的系数(Coeffcient),构成形如


y=a1 * x1 + a2 * x2 + a3 * x3 + ... + an * xn

其中:a1,a2,... an是系数,x1,x2,... ,xn是变量值。

的判别式和阈值。而判别阶段可以根据这个判别式计算出y,并根据阈值将样本进行分类。

2. 在R中使用Fisher判别

R中使用Fisher判别说起来很简单,但是我当初也放狗搜索了不短的时间才搞明白如何使用。

首先,它在R里不叫Fisher,用Fisher搜索多半误入歧途。在R中,它叫LDA(Linear Discriminative Analysis)。

其次,它存在于一个叫MASS的包里。在ubuntu 13.10中使用:


sudo apt-get install r-base

这样安装以后默认就有,然后使用下面语句引用这个包:


> library(MASS)

再次,引用了MASS包以后就可以使用lda命令了:


> params <- lda(y~x1+x2+x3, data=d)

其中,第一个参数是判别式的形式,第二个参数是用来训练的样本数据。lda命令执行后,会输出构成判别式的各个系数。

最后,使用predict命令对未分类的样本进行判别。


> predict(params, newdata)

其中,第一个参数是上一阶段lda命令的结果,第二个参数是用来分类的样本数据。自此,整个fisher判别过程完成。

3. 实例

3.1 数据

准备好两个csv文件,用来训练的已分类数据叫learn.csv,用来判别的未分类数据叫infer.csv。learn.csv共有六列构成,其第一行分别为Band1,Band2,Band3,Band4, Band5, Class,分别代表变量1、变量2、变量3和类别。infer.csv由六列构成:Band1, Band2, Band3, Band4, Band5。同样第一列包含列名。csv文件的字段间都用逗号分隔。

3.2 操作步骤

1. 读取learn.csv


> d <- read.csv("~/data/learn.csv")
> d2 <- read.csv("~/data/infer.csv")

2. 训练


> lda(Class ~ Band1+Band2+Band3+Band4+Band5, data=d)

训练结果:


> params
Call:
lda(Class ~ Band1 + Band2 + Band3 + Band4 + Band5, data = data)

Prior probabilities of groups:
    0     1 
0.4220068 0.5779932 

Group means:
   Band1   Band2   Band3  Band4  Band5
0 318.3189 0.0000000 0.0000000 0.00000 0.00000
1 322.1881 -0.7703634 -0.2642972 33.92608 36.39715

Coefficients of linear discriminants:
       LD1
Band1 0.02173212
Band2 -0.08647688
Band3 -0.01199366
Band4 0.10619769
Band5 0.10560976

3. 判别


> ret <- predict(params, d2)

输出结果:


> write.csv(d2, file="~/data/output.csv"

到此这篇关于R语言中Fisher判别的使用方法的文章就介绍到这了,更多相关R语言中Fisher判别内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: R语言中Fisher判别的使用方法

本文链接: https://www.lsjlt.com/news/121856.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • R语言中Fisher判别的使用方法
    最近编写了Fisher判别的相关代码时,需要与已有软件比照结果以确定自己代码的正确性,于是找到了安装方便且免费的R。这里把R中进行Fisher判别的方法记录下来。 1. 判别分析与F...
    99+
    2022-11-11
  • 如何在R语言中使用Fisher进行判断
    如何在R语言中使用Fisher进行判断?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1. 判别分析与Fisher判别不严谨但是通俗的说法,判别分析(Discriminant...
    99+
    2023-06-14
  • R语言判断语句的使用详解
    目录if 语句if...else 语句switch 语句判断结构要求程序员指定一个或多个要评估或测试的条件,以及条件为真时要执行的语句(必需的)和条件为假时要执行的语句(可选的)。 ...
    99+
    2022-11-11
  • 使用R语言填补缺失值的方法
    使用R语言填补缺失值 数据处理过程中,往往会存在缺失值,对于缺失值的处理,目前各大统计书提出的方法有剔除,用均数填补,用众数填补,采用其他自变量进行回归,推算缺失值进行填补等。在R语...
    99+
    2022-11-11
  • R语言seq()函数的调用方法
    看到有很多读者浏览了这篇文章,心里很是开心,为了能够更好地帮助大家,决定再修改一下,帮助大家更好地理解。 --------修改于:2018年4月28日 为了方便大家在开发环境中直接实...
    99+
    2022-11-11
  • R语言的Dataframe常用操作方法
    这篇文章主要讲解了“R语言的Dataframe常用操作方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“R语言的Dataframe常用操作方法”吧!上节我们简单介绍了Dataframe的定义...
    99+
    2023-06-20
  • 使用R语言实现自动文摘的方法
    目录准备工作文本预处理基于词频-逆文档频率(TF-IDF)的自动文摘计算TF-IDF值提取关键词生成摘要基于潜在语义分析(LSA)的自动文摘计算主题提取主题词生成摘要结论自动文摘(A...
    99+
    2023-05-20
    R语言自动文摘 R语言文摘
  • R语言列筛选的方法select怎么使用
    这篇文章主要介绍了R语言列筛选的方法select怎么使用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇R语言列筛选的方法select怎么使用文章都会有所收获,下面我们一起来看看吧。1. 数据描述数据来源是我编写...
    99+
    2023-07-02
  • R语言中的更新方法有哪些
    这篇文章将为大家详细讲解有关R语言中的更新方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。宏包的更新卸载packageremove.packages("mypackage")查...
    99+
    2023-06-14
  • R语言中na.fail和na.omit的用法
    实际工作中,数据集很少是完整的,许多情况下样本中都会包括若干缺失值NA,这在进行数据分析和挖掘时比较麻烦。 R语言通过na.fail和na.omit可以很好地处理样本中的缺失值 1、...
    99+
    2022-11-12
  • R语言中xtabs函数的用法
    这篇文章将为大家详细讲解有关R语言中xtabs函数的用法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。今天在做一个列联表独立性检验的时候,总是无法处理好要求的数据类型,偶然的机会,看到了xtabs()函数...
    99+
    2023-06-14
  • 使用R语言批量修改文件名的方法
    在R语言默认目录下有一文件夹test,其下有三个文件,分别是test1.txt, text2.txt, text3.txt, 现在要对这三个文件进行批量的修改。主要使用到了...
    99+
    2022-11-11
  • R语言中的五种常用统计分析方法
    1、分组分析aggregation 根据分组字段,将分析对象划分为不同的部分,以进行对比分析各组之间差异性的一种分析方法。 常用统计指标: 计数 length 求和 sum 平均值 ...
    99+
    2022-11-12
  • R语言中cbind、rbind和merge函数的使用与区别
    cbind: 根据列进行合并,即叠加所有列,m列的矩阵与n列的矩阵cbind()最后变成m+n列,合并前提:cbind(a, c)中矩阵a、c的行数必需相符 rbind: 根据行进行...
    99+
    2022-11-11
  • R语言中devtools的使用详解
    今天安装r语言devtools包,尝试很多种方法也不能决解,下面这个问题是改变镜像,然后就会可以安装了(3.4.2版本) Warning in install.packages ...
    99+
    2022-11-12
  • R语言中do.call()的使用说明
    简单参数设置就能搞定的事情,是不会用到do.call的。 在运用R的过程中总会碰到这样一类函数,它们接受的参数数量可以是任意的,该函数会处理这些参数,并返回处理结果。 最简单的例子就...
    99+
    2022-11-12
  • R语言使用ggplot绘制画中画细节放大的方法
    目录1. 载入相关包2. 数据生成3. 基础绘图4. 放大效果5. 绘图美化其他方法当我们在利用ggplot绘图时,当遇到一些量纲相差过大,或者一些图的某些点排布密集时,需要将细节部...
    99+
    2022-11-12
  • R语言histogram(直方图)的具体使用
    最近小仙同学很是烦恼,本以为自己已经掌握了ggplot2作图的语法,用read.csv(), ggplot()+geom_point()/boxplot()/violinplot()...
    99+
    2022-11-11
  • R语言中qplot()函数的用法说明
    ggplot2()函数 ggplot2是一个强大的作图工具,它可以让你不受现有图形类型的限制,创造出任何有助于解决你所遇到问题的图形。 qplot() qplot()属于ggplot...
    99+
    2022-11-12
  • R语言中ifelse、which、%in%的用法详解
    ifelse、which、%in%是R语言里极其重要的函数,以后会经常在别的程序中看到。 ifelse ifelse是if条件判断语句的简写,它的用法如下: ifelse(tes...
    99+
    2022-11-12
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作