En este artículo, discutiremos cómo crear la tabla dinámica en el lenguaje de programación R.
La tabla dinámica es una de las características más poderosas de Microsoft Excel que nos permite extraer el significado de un conjunto de datos grande y detallado. Una tabla dinámica a menudo muestra algún valor estadístico sobre el conjunto de datos al agrupar algunos valores de una columna. Para hacerlo en el lenguaje de programación R, usamos las funciones group_by() y resume() de la biblioteca de paquetes dplyr. El paquete dplyr en el lenguaje de programación R es una estructura de manipulación de datos que proporciona un conjunto uniforme de verbos que nos ayudan en el preprocesamiento de grandes datos. La función group_by() agrupa los datos usando una o más variables y luego la función de resumen crea el resumen de los datos por esos grupos usando la función agregada que se le pasa.
Sintaxis:
df %>% group_by( grouping_variables) %>% resume( label = added_fun() )
Parámetro:
- df: determina el marco de datos en uso.
- grouping_variables: determina la variable utilizada para agrupar datos.
- added_fun(): determina la función utilizada para el resumen. por ejemplo, suma, media, etc.
Ejemplo 1: crear tablas dinámicas
R
# create sample data frame sample_data <- data.frame(label=c('Geek1', 'Geek2', 'Geek3', 'Geek1', 'Geek2', 'Geek3', 'Geek1', 'Geek2', 'Geek3'), value=c(222, 18, 51, 52, 44, 19, 100, 98, 34)) # load library dplyr library(dplyr) # create pivot table with sum of value as summary sample_data %>% group_by(label) %>% summarize(sum_values = sum(value))
Producción:
# A tibble: 3 x 2 label sum_values <chr> <dbl> 1 Geek1 374 2 Geek2 160 3 Geek3 104
Ejemplo 2: crear una tabla dinámica
R
# create sample data frame sample_data <- data.frame(label=c('Geek1', 'Geek2', 'Geek3', 'Geek1', 'Geek2', 'Geek3', 'Geek1', 'Geek2', 'Geek3'), value=c(222, 18, 51, 52, 44, 19, 100, 98, 34)) # load library dplyr library(dplyr) # create pivot table with sum of value as summary sample_data %>% group_by(label) %>% summarize(average_values = mean(value))
Producción:
# A tibble: 3 x 2 label average_values <chr> <dbl> 1 Geek1 125. 2 Geek2 53.3 3 Geek3 34.7
Publicación traducida automáticamente
Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA