广告
返回顶部
首页 > 资讯 > 后端开发 > 其他教程 >R语言随机抽样详解
  • 494
分享到

R语言随机抽样详解

R语言随机抽样R语言抽样 2022-11-13 19:11:35 494人浏览 独家记忆
摘要

目录专题:随机抽样简单随机抽样sample函数srswor函数srswr函数分层抽样专题:随机抽样 简单随机抽样 从总体中抽取样本的方法很多,最常用的方法是简单随机抽样。 简单随机抽

专题:随机抽样

简单随机抽样

从总体中抽取样本的方法很多,最常用的方法是简单随机抽样。

简单随机抽样:从容量为N的总体中,任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。

  • 放回抽样(重复抽样):本次从整体中抽取的数据样本,在下一次抽取时同样有机会被抽取。
  • 不放回抽样(不重复抽样):一旦被抽取为样本,下次就不能再被抽取了。

srswr() srswor() sample()

sample函数

sample可以实现放回随机抽样和不放回随机抽样,也可以对数据进行随机分组。

格式:

 sample(x, size, replace=FALS, prob=NULL)

参数说明:

参数说明
x为向量,表示抽样的总体,或者是一个正整数,表示样本总体为1~n;
size为样本容量,即要抽取的样本个数,是一个非负整数;
replace表示是否为有放回的抽样,是一个逻辑值,默认为FALSE,即默认为无放回抽样;
prob为权重向量,即x中元素被抽取到的概率,是一个取值0~1的向量,其长度应该与x的长度相同。

从26个大写字母中不放回随机抽取5个

> sample(LETTERS,5)
[1] "E" "W" "L" "X" "Q"

将26个大写字母随机分成2组,第2组和第1组的比例为7:3

> n<-sample(2,26,replace = TRUE,prob=c(0.7,0.3))
> n
 [1] 1 1 2 1 1 2 2 2 1 1 2 1 1 1 2 2 1 2 1 2 1 2 1 1 1 1
> sample1<-LETTERS[n==1]
> sample2<-LETTERS[n==2]
> sample1
 [1] "A" "B" "D" "E" "I" "J" "L" "M" "N" "Q" "S" "U" "W" "X" "Y" "Z"
> sample2
 [1] "C" "F" "G" "H" "K" "O" "P" "R" "T" "V"

将26个大写字母随机分成3组,每组的个数分配比例为0.4,0.4,0.2

> n<-sample(3,26,replace = TRUE,prob = c(0.4,0.4,0.2))
> n
 [1] 2 1 2 1 3 2 3 1 3 1 1 1 1 2 1 1 2 3 3 1 2 3 3 2 2 3
> sample1<-LETTERS[n==1]
> sample1
 [1] "B" "D" "H" "J" "K" "L" "M" "O" "P" "T"
> sample2<-LETTERS[n==2]
> sample2
[1] "A" "C" "F" "N" "Q" "U" "X" "Y"
> sample3<-LETTERS[n==3]
> sample3
[1] "E" "G" "I" "R" "S" "V" "W" "Z"

有10位学生的学号分别为1,2,…,10,现在要进行毕业答辩,答辩顺序要求 随机产生。请给出代码。

> sample(10)
 [1]  7  9 10  6  3  4  1  2  5  8
> x=c(1,3,5,7)
> sample(x,size=20,replace=T, prob=c(0.1,0.2,0.3,0.9))
 [1] 5 3 7 7 5 7 7 7 7 5 7 7 7 1 7 3 1 7 1 7

结论:对每一个元素都可以给定一个概率,且每个概率是独立的,即在参数prob中,不一定所有元素的概率加起来等于1,它只代表某元素被抽取的概率而已。

模拟抛硬币游戏,抛10次,看看出现正面H(Heads)和反面T(Tails)的情况。

将抛硬币视为有放回的实验,即将参数replace设置为TRUE。

> sample(c("H","F"),10,replace = TRUE)
 [1] "H" "F" "H" "F" "F" "F" "F" "H" "H" "H"

某篮球运动员投篮命中率为70%,模拟10次投篮的命中(S)和未命中(F)情况。

> sample(c("S","F"),10,replace = TRUE,prob = c(0.7,0.3))
 [1] "S" "S" "F" "S" "S" "S" "F" "S" "S" "S"

srswor函数

Simple random sampling without replacement

Description:Draws a simple random sampling without replacement of size n (equal probabilities, fixed sample size, without replacement).

Usage:srswor(n,N)

Value:Returns a vector (with elements 0 and 1) of size N, the population size. Each element k of this vector indicates the status of unit k (1, unit k is selected in the sample; 0, otherwise).

> library(sampling)
> s<-srswor(10,26)
> s
 [1] 1 0 0 1 0 0 1 0 1 0 0 1 1 0 0 1 1 0 0 0 1 0 1 0 0 0
> obs<-which(s==1)
> obs
 [1]  1  4  7  9 12 13 16 17 21 23
> sample<-LETTERS[obs]
> sample
 [1] "A" "D" "G" "I" "L" "M" "P" "Q" "U" "W"

在26个中抽取10个,1表示被抽取的状态,0表示没有被抽取状态

srswr函数

Simple random sampling with replacement

Description:Draws a simple random sampling with replacement of size n (equal probabilities, fixed sample size, without replacement).

Usage:srswr(n,N)

Value:Returns a vector of size N, population size. Each element k of this vector indicates the number of replicates for unit k in the sample.

> s<-srswr(10,26)
> s
 [1] 1 2 0 0 0 1 2 0 0 0 0 0 0 0 0 0 0 1 1 1 0 1 0 0 0 0
> obs<-which(s!=0)
> obs
[1]  1  2  6  7 18 19 20 22
> sample<-LETTERS[obs]
> sample
[1] "A" "B" "F" "G" "R" "S" "T" "V"

分层抽样

分层抽样将分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。

这种方法的优点是,样本的代表性比较好,抽样误差比较小。缺点是抽样手续较简单随机抽样还要繁杂些。

R语言sampling包的sampling::strata()可以实现

其命令为:

strata(data, stratanames=NULL, size, method=c(“srswor”,“srswr”,“poisson”,“systematic”), pik,description=FALSE)

其中,x为样本数据, stratanames为分层抽样要使用的变量,size为各层抽取个数,method指的是抽样方法,“srswor”、“srswr”、“poisson”、"systematic"分别指不重置简单抽样、重置简单抽样、泊松抽样、系统抽样,pik指的是各数据包含在样本中的概率,description默认为FALSE,若设置为TRUE则输出样本个数和总体个数。返回值ID_unit(被选单元的标志符)、Stratum(单元层)、Prob(包含单元的概率)

> library(sampling)
> x<-strata(c("Species"),size=c(2,3,4),method="srswor",data=iris)
> x
       Species ID_unit Prob Stratum
11      setosa      11 0.04       1
21      setosa      21 0.04       1
68  versicolor      68 0.06       2
83  versicolor      83 0.06       2
98  versicolor      98 0.06       2
102  virginica     102 0.08       3
103  virginica     103 0.08       3
111  virginica     111 0.08       3
112  virginica     112 0.08       3

到此这篇关于R语言随机抽样的文章就介绍到这了,更多相关R语言随机抽样内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: R语言随机抽样详解

本文链接: https://www.lsjlt.com/news/170842.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • R语言随机抽样详解
    目录专题:随机抽样简单随机抽样sample函数srswor函数srswr函数分层抽样专题:随机抽样 简单随机抽样 从总体中抽取样本的方法很多,最常用的方法是简单随机抽样。 简单随机抽...
    99+
    2022-11-13
    R语言随机抽样 R语言抽样
  • R语言怎么用sample函数实现随机抽样
    这篇文章将为大家详细讲解有关R语言怎么用sample函数实现随机抽样,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。用sample函数实现随机抽样sample(x, siz...
    99+
    2022-10-19
  • R语言生成随机数实例讲解
    1.概述 作为一种语言进行统计分析,R有一个随机数生成各种统计分布功能的综合性图书馆。R语言可以针对不同的分布,生成该分布下的随机数。其中,有许多常用的个分布可以直接调用。本文简单介...
    99+
    2022-11-11
  • R语言如何随机从数据框抽取一部分数据
    这篇文章将为大家详细讲解有关R语言如何随机从数据框抽取一部分数据,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。随机从数据框(矩阵)抽取一部分数据(col.name=col...
    99+
    2022-10-19
  • R语言关于随机森林算法的知识点详解
    在随机森林方法中,创建大量的决策树。 每个观察被馈入每个决策树。 每个观察的最常见的结果被用作最终输出。 新的观察结果被馈入所有的树并且对每个分类模型取多数投票。 对构建树时未使用的...
    99+
    2022-11-12
  • C语言实现随机抽奖程序
    本文实例为大家分享了C语言实现抽奖小程序的具体代码,供大家参考,具体内容如下 #include<stdio.h> #include<stdlib.h> #...
    99+
    2022-11-12
  • R语言生成随机数的方法
    这篇文章主要介绍R语言生成随机数的方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!1.概述作为一种语言进行统计分析,R有一个随机数生成各种统计分布功能的综合性图书馆。R语言可以针对不同的分布,生成该分布下的随机数。...
    99+
    2023-06-14
  • R语言如何实现随机森林
    这篇文章主要为大家展示了“R语言如何实现随机森林”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“R语言如何实现随机森林”这篇文章吧。随机森林算法介绍算法介绍:简单的说,随机森林就是用随机的方式建立...
    99+
    2023-06-20
  • R语言随机数生成的实现
    1. 均匀分布 函数: runif(n, min=0, max=1),n 表示生成的随机数数量,min 表示均匀分布的下限,max 表示均匀分布的上限,若省略参min、max,则默认...
    99+
    2022-11-11
  • r语言怎么生成随机数整数
    在R语言中,可以使用以下几个函数来生成随机整数:1. `sample()`函数:可以从指定的整数序列中随机抽取一个或多个整数。例如,...
    99+
    2023-09-04
    r语言
  • C语言怎么实现随机抽奖程序
    要实现随机抽奖程序,可以按照以下步骤进行:1. 导入头文件:```c#include #include #include ```2....
    99+
    2023-08-18
    C语言
  • C语言实现随机抽取纸牌程序
    本文实例为大家分享了C语言实现随机抽取纸牌的具体代码,供大家参考,具体内容如下 程序设计要求 本程序负责发一副标准纸牌,每张标准纸牌都有一种花色(梅花、方块、黑桃、红桃)和一个等级(...
    99+
    2022-11-13
  • C语言的随机数rand()函数详解
    在生活中很多场景下都需要产生随机数,比如抽奖,打牌,游戏等场景下就需要使用随机数。在C语言标准库函数里面有专门用来产生随机数的函数rand,它的函数原型如下: int __cde...
    99+
    2022-11-13
  • C语言中随机数rand()函数详解
      在生活中很多场景下都需要产生随机数,比如抽奖,打牌,游戏等场景下就需要使用随机数。在C语言标准库函数里面有专门用来产生随机数的函数rand,它的函数原型如下:...
    99+
    2022-11-13
  • R语言实现随机森林的方法示例
    目录随机森林算法介绍算法介绍:决策树生长步骤:投票过程:基本思想:随机森林的优点:缺点R语言实现随机森林模型搭建1:randomForest()函数用于构建随机森林模型2:impor...
    99+
    2022-11-12
  • 使用R语言怎么生成一个随机数
    这篇文章给大家介绍使用R语言怎么生成一个随机数,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。1. 均匀分布函数: runif(n, min=0, max=1),n 表示生成的随机数数量,min 表示均匀分布的下限,ma...
    99+
    2023-06-13
  • C语言如何实现随机抽取纸牌程序
    本篇内容主要讲解“C语言如何实现随机抽取纸牌程序”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“C语言如何实现随机抽取纸牌程序”吧!程序设计要求本程序负责发一副标准纸牌,每张标准纸牌都有一种花色(...
    99+
    2023-06-29
  • R语言中merge函数详解
    1、创建测试数据: name <- c('A','B','A','A','C','D') school <- c('s1','s2','s1','s1','s1','...
    99+
    2022-11-12
  • R语言中aggregate 函数详解
    目录R语言中aggregate 函数001、测试数据框002、 调用函数R语言中aggregate 函数 aggregate函数是数据处理中常用到的函数,具有强大的功能。可以按照要求...
    99+
    2023-05-17
    R语言aggregate 函数 aggregate 函数
  • 详解Go语言中rand(随机数)包的使用
    目录包"math/rand"随机数种子随机函数rand.Int()rand.Intn(n)实例其他随机函数按类型随机类指定随机范围类伪随机排列的切片生成标准正态分...
    99+
    2022-11-11
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作