Seleccionar muestras aleatorias en R usando Dplyr

En este artículo, veremos diferentes métodos para seleccionar muestras aleatorias del paquete Dplyr del lenguaje de programación R.

Para instalar e importar el paquete Dplyr en el lenguaje de programación R, el usuario debe seguir la sintaxis:

Sintaxis:

instalar.paquetes(“dplyr”)

biblioteca (dplyr)

Método 1: Usar la función Sample_n() 

La función Sample_n() se usa para seleccionar n filas aleatorias de un marco de datos en R. Esta es una de las funciones más utilizadas del lenguaje de programación R, ya que esta función se usa para probar los diversos modelos de compilación del usuario con fines de predicción y precisión.

Sintaxis: sample_n(tbl, size, replace, fac, …)

Parámetros:

  • tbl: un objeto Momocs (Coo, Coe)
  • tamaño: numérico cuántas formas debemos muestrear
  • replace: lógico si la muestra debe hacerse con o sin reemplazo
  • fac: un nombre de columna si se define un $fac; el tamaño se aplica luego dentro de los niveles de este factor
  • …: argumentos adicionales para dplyr::sample_n y para mantener la compatibilidad genérica

Devolver:

Esta función devolverá las muestras aleatorias de los datos proporcionados de tamaño n.

Ejemplo: programa R para generar una muestra aleatoria usando sample_n()

R

library(dplyr)
  
gfg_data <- iris
sample_n(gfg_data,10)

Producción:

Método 2: Usar la función Sample_frac()

La función Sample_frac() selecciona un porcentaje aleatorio n de filas de un marco de datos o tabla, el uso de esta función es similar a la función sample_n(), y esta función se usa ampliamente en el lenguaje de programación R.

Sintaxis: sample_frac(tbl, size, replace, fac, …)

Parámetros:

  • tbl: un objeto Momocs (Coo, Coe)
  • tamaño: numérico (0 < numérico <= 1) la fracción de formas para seleccionar
  • replace: lógico si la muestra debe hacerse con o sin reemplazo
  • fac: un nombre de columna si se define un $fac; el tamaño se aplica luego dentro de los niveles de este factor
  • …: argumentos adicionales para dplyr::sample_frac y para mantener la compatibilidad genérica

Ejemplo: programa R para generar una muestra aleatoria usando sample_frac()

R

library(dplyr)
  
gfg_data <- iris
sample_frac(gfg_data,0.065)

Producción:

Publicación traducida automáticamente

Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *