En este artículo, veremos diferentes métodos para seleccionar muestras aleatorias del paquete Dplyr del lenguaje de programación R.
Para instalar e importar el paquete Dplyr en el lenguaje de programación R, el usuario debe seguir la sintaxis:
Sintaxis:
instalar.paquetes(“dplyr”)
biblioteca (dplyr)
Método 1: Usar la función Sample_n()
La función Sample_n() se usa para seleccionar n filas aleatorias de un marco de datos en R. Esta es una de las funciones más utilizadas del lenguaje de programación R, ya que esta función se usa para probar los diversos modelos de compilación del usuario con fines de predicción y precisión.
Sintaxis: sample_n(tbl, size, replace, fac, …)
Parámetros:
- tbl: un objeto Momocs (Coo, Coe)
- tamaño: numérico cuántas formas debemos muestrear
- replace: lógico si la muestra debe hacerse con o sin reemplazo
- fac: un nombre de columna si se define un $fac; el tamaño se aplica luego dentro de los niveles de este factor
- …: argumentos adicionales para dplyr::sample_n y para mantener la compatibilidad genérica
Devolver:
Esta función devolverá las muestras aleatorias de los datos proporcionados de tamaño n.
Ejemplo: programa R para generar una muestra aleatoria usando sample_n()
R
library(dplyr) gfg_data <- iris sample_n(gfg_data,10)
Producción:
Método 2: Usar la función Sample_frac()
La función Sample_frac() selecciona un porcentaje aleatorio n de filas de un marco de datos o tabla, el uso de esta función es similar a la función sample_n(), y esta función se usa ampliamente en el lenguaje de programación R.
Sintaxis: sample_frac(tbl, size, replace, fac, …)
Parámetros:
- tbl: un objeto Momocs (Coo, Coe)
- tamaño: numérico (0 < numérico <= 1) la fracción de formas para seleccionar
- replace: lógico si la muestra debe hacerse con o sin reemplazo
- fac: un nombre de columna si se define un $fac; el tamaño se aplica luego dentro de los niveles de este factor
- …: argumentos adicionales para dplyr::sample_frac y para mantener la compatibilidad genérica
Ejemplo: programa R para generar una muestra aleatoria usando sample_frac()
R
library(dplyr) gfg_data <- iris sample_frac(gfg_data,0.065)
Producción:
Publicación traducida automáticamente
Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA