R语言 使用Dplyr选择随机样本

R语言 使用Dplyr选择随机样本

在这篇文章中,我们将研究从R编程语言的Dplyr包中选择随机样本的不同方法。

要在R编程语言中安装和导入Dplyr包,用户需要遵循以下语法。

语法

install.packages(“dplyr”)

library(dplyr)

方法1:使用Sample_n()函数

Sample_n() 函数用于从R语言的数据框中选择n个随机行。这是R编程语言中广泛使用的函数之一,因为该函数用于测试用户建立的各种模型的预测和准确性。

语法: sample_n(tbl, size, replace, fac, …)

参数

  • tbl:一个Momocs对象(Coo, Coe)
  • size:数字,我们应该对多少个形状进行采样
  • replace:逻辑性的,是否应该用替换的方式进行采样
  • fac:如果定义了$fac,则为列名;然后在这个因素的级别内应用大小。
  • …:dplyr::sample_n的附加参数,以保持通用兼容性。

返回。
该函数将从提供的数据中返回大小为n的随机样本。

示例: 使用sample_n()生成随机样本的R程序

library(dplyr)
  
gfg_data <- iris
sample_n(gfg_data,10)

输出

使用Dplyr在R中选择随机样本

方法2:使用Sample_frac()函数

Sample_frac() 函数从数据框或表中随机选择n个百分比的行,这个函数的使用与sample_n()函数类似,这个函数在R编程语言中被广泛使用。

语法: sample_frac(tbl, size, replace, fac, …)

参数

  • tbl:一个Momocs对象(Coo, Coe)。
  • size:数字(0 < numeric <= 1),要选择的形状的百分比
  • replace:逻辑性的,是否应该用替换的方式进行采样
  • fac:如果定义了$fac,则为列名;然后在这个因素的级别内应用大小。
  • …:dplyr::sample_frac的附加参数,以保持通用兼容性。

示例: 使用sample_frac()生成随机样本的R程序

library(dplyr)
  
gfg_data <- iris
sample_frac(gfg_data,0.065)

输出

使用Dplyr在R中选择随机样本

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程