¿Cómo generar una muestra usando la función de muestra en R?

En este artículo, discutiremos cómo generar una muestra usando la función de muestra en R.

La función Sample() se utiliza para generar elementos aleatorios a partir de los datos proporcionados con o sin reemplazo.

Sintaxis :

sample(data, size, replace = FALSE, prob = NULL)

dónde,

  • los datos pueden ser un vector o un marco de datos
  • size representa el tamaño de la muestra
  • replace se usa para establecer los valores nuevamente repetidos si se establece en verdadero
  • prob: un vector de pesos de probabilidad para obtener los elementos del vector que se está muestreando

Ejemplo 1: generar datos de muestra a partir del vector

Aquí, generaremos los n datos de muestra del vector dado con 11 elementos usando la función de muestra.

R

# consider the vector
data=c(23,45,21,34,5,6,7,8,86,45,3)
  
# get 4 random elements
print(sample(data,4))
  
# get 1 random element
print(sample(data,1))
  
# get 6 random elements
print(sample(data,6))

Producción:

[1] 45  7  5 34
[1] 3
[1]  5 23  8 21  6 45

Ejemplo 2: generar datos de muestra del vector reemplazando

Aquí vamos a crear un vector con 11 elementos y generar los datos de muestra con un reemplazo.

R

# consider the vector
data=c(23,45,21,34,5,6,7,8,86,45,3)
  
# get 4 random elements
print(sample(data,4,replace=TRUE))
  
# get 1 random element
print(sample(data,1,replace=TRUE))
  
# get 6 random elements
print(sample(data,6,replace=TRUE))

Producción:

[1] 45  5  5  3
[1] 86
[1]  5  5  8  7  8 45

Ejemplo 3: Muestreo con probabilidades desiguales usando la función de muestra

Aquí vamos a seleccionar los elementos con mayor probabilidad que otros estableciendo la probabilidad usando el parámetro prob.

R

# consider the vector
data=c(23,45,21,34,5)
  
# get 10 random elements with probability
print(sample(data, size = 10, replace = TRUE, 
             prob = c(0.6,0.1,0.1,0.1,0.1)))

Producción:

 [1] 23 23 23 23 23 45 23 23 23 23

Ejemplo 4: Muestreo aleatorio de filas de marcos de datos usando la función de muestra

Aquí vamos a probar el marco de datos, vamos a crear un marco de datos y probar las filas.

R

# create dataframe with 2 columns
data=data.frame(col1=c(1:10),col2=c(12:21))
  
# get the sample of 4 in each column
data[sample(1:nrow(data), size = 4), ]

Producción:

Ejemplo 5: Muestreo aleatorio de elementos de lista usando la función de muestra

Aquí vamos a muestrear los datos en la lista con tamaño 4

R

# create list with some integers
data=list(1,2,3,4,5,6)
  
# get the sample of 4
data[sample(1:length(data), size = 4)]

Producción:

[[1]]
[1] 2

[[2]]
[1] 1

[[3]]
[1] 4

[[4]]
[1] 6

Publicación traducida automáticamente

Artículo escrito por sireeshakanneganti112 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *