Tomar muestras aleatorias de un marco de datos en programación R – función sample_n()

sample_n()La función en R Language se usa para tomar muestras aleatorias de un marco de datos.

Sintaxis: muestra_n(x, n)

Parámetros:
x: marco de datos
n: tamaño/número de elementos a seleccionar

Ejemplo 1:

# R program to collect sample data
# from a data frame
  
# Loading library 
library(dplyr)
    
# Create a data frame
d <- data.frame( name = c("Abhi", "Bhavesh", "Chaman", "Dimri"),  
                 age = c(7, 5, 9, 16),  
                 ht = c(46, NA, NA, 69), 
                 school = c("yes", "yes", "no", "no") ) 
  
# Printing three rows 
sample_n(d, 3) 

Producción:

     name age ht school
1  Chaman   9 NA     no
2    Abhi   7 46    yes
3 Bhavesh   5 NA    yes

Ejemplo 2:

# R program to collect sample data
# from a data frame
  
# Loading library 
library(dplyr)
    
# Create a data frame
d <- data.frame( name = c("Abhi", "Bhavesh", "Chaman", "Dimri"),  
                 age = c(7, 5, 9, 16),  
                 ht = c(46, NA, NA, 69), 
                 school = c("yes", "yes", "no", "no") ) 
  
# Printing three rows 
sample_n(d, 3, fac = "name")$name

Producción:

[1] Chaman  Bhavesh Dimri  
Levels: Abhi Bhavesh Chaman Dimri

Aquí, en el código anterior, se especifica el nombre de la columna. Por lo tanto, el tamaño se aplica dentro del factor.

Publicación traducida automáticamente

Artículo escrito por nidhi_biet y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *