R语言 使用Dplyr选择随机样本
在这篇文章中,我们将研究从R编程语言的Dplyr包中选择随机样本的不同方法。
要在R编程语言中安装和导入Dplyr包,用户需要遵循以下语法。
语法
install.packages(“dplyr”)
library(dplyr)
方法1:使用Sample_n()函数
Sample_n() 函数用于从R语言的数据框中选择n个随机行。这是R编程语言中广泛使用的函数之一,因为该函数用于测试用户建立的各种模型的预测和准确性。
语法: sample_n(tbl, size, replace, fac, …)
参数
- tbl:一个Momocs对象(Coo, Coe)
- size:数字,我们应该对多少个形状进行采样
- replace:逻辑性的,是否应该用替换的方式进行采样
- fac:如果定义了$fac,则为列名;然后在这个因素的级别内应用大小。
- …:dplyr::sample_n的附加参数,以保持通用兼容性。
返回。
该函数将从提供的数据中返回大小为n的随机样本。
示例: 使用sample_n()生成随机样本的R程序
library(dplyr)
gfg_data <- iris
sample_n(gfg_data,10)
输出
方法2:使用Sample_frac()函数
Sample_frac() 函数从数据框或表中随机选择n个百分比的行,这个函数的使用与sample_n()函数类似,这个函数在R编程语言中被广泛使用。
语法: sample_frac(tbl, size, replace, fac, …)
参数
- tbl:一个Momocs对象(Coo, Coe)。
- size:数字(0 < numeric <= 1),要选择的形状的百分比
- replace:逻辑性的,是否应该用替换的方式进行采样
- fac:如果定义了$fac,则为列名;然后在这个因素的级别内应用大小。
- …:dplyr::sample_frac的附加参数,以保持通用兼容性。
示例: 使用sample_frac()生成随机样本的R程序
library(dplyr)
gfg_data <- iris
sample_frac(gfg_data,0.065)
输出
极客教程