En este artículo, discutiremos cómo generar una muestra usando la función de muestra en R.
La función Sample() se utiliza para generar elementos aleatorios a partir de los datos proporcionados con o sin reemplazo.
Sintaxis :
sample(data, size, replace = FALSE, prob = NULL)
dónde,
- los datos pueden ser un vector o un marco de datos
- size representa el tamaño de la muestra
- replace se usa para establecer los valores nuevamente repetidos si se establece en verdadero
- prob: un vector de pesos de probabilidad para obtener los elementos del vector que se está muestreando
Ejemplo 1: generar datos de muestra a partir del vector
Aquí, generaremos los n datos de muestra del vector dado con 11 elementos usando la función de muestra.
R
# consider the vector data=c(23,45,21,34,5,6,7,8,86,45,3) # get 4 random elements print(sample(data,4)) # get 1 random element print(sample(data,1)) # get 6 random elements print(sample(data,6))
Producción:
[1] 45 7 5 34 [1] 3 [1] 5 23 8 21 6 45
Ejemplo 2: generar datos de muestra del vector reemplazando
Aquí vamos a crear un vector con 11 elementos y generar los datos de muestra con un reemplazo.
R
# consider the vector data=c(23,45,21,34,5,6,7,8,86,45,3) # get 4 random elements print(sample(data,4,replace=TRUE)) # get 1 random element print(sample(data,1,replace=TRUE)) # get 6 random elements print(sample(data,6,replace=TRUE))
Producción:
[1] 45 5 5 3 [1] 86 [1] 5 5 8 7 8 45
Ejemplo 3: Muestreo con probabilidades desiguales usando la función de muestra
Aquí vamos a seleccionar los elementos con mayor probabilidad que otros estableciendo la probabilidad usando el parámetro prob.
R
# consider the vector data=c(23,45,21,34,5) # get 10 random elements with probability print(sample(data, size = 10, replace = TRUE, prob = c(0.6,0.1,0.1,0.1,0.1)))
Producción:
[1] 23 23 23 23 23 45 23 23 23 23
Ejemplo 4: Muestreo aleatorio de filas de marcos de datos usando la función de muestra
Aquí vamos a probar el marco de datos, vamos a crear un marco de datos y probar las filas.
R
# create dataframe with 2 columns data=data.frame(col1=c(1:10),col2=c(12:21)) # get the sample of 4 in each column data[sample(1:nrow(data), size = 4), ]
Producción:
Ejemplo 5: Muestreo aleatorio de elementos de lista usando la función de muestra
Aquí vamos a muestrear los datos en la lista con tamaño 4
R
# create list with some integers data=list(1,2,3,4,5,6) # get the sample of 4 data[sample(1:length(data), size = 4)]
Producción:
[[1]] [1] 2 [[2]] [1] 1 [[3]] [1] 4 [[4]] [1] 6
Publicación traducida automáticamente
Artículo escrito por sireeshakanneganti112 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA