¿Cómo crear tablas dinámicas en R?

En este artículo, discutiremos cómo crear la tabla dinámica en el lenguaje de programación R.

La tabla dinámica es una de las características más poderosas de Microsoft Excel que nos permite extraer el significado de un conjunto de datos grande y detallado. Una tabla dinámica a menudo muestra algún valor estadístico sobre el conjunto de datos al agrupar algunos valores de una columna. Para hacerlo en el lenguaje de programación R, usamos las funciones group_by() y resume() de la biblioteca de paquetes dplyr. El paquete dplyr en el lenguaje de programación R es una estructura de manipulación de datos que proporciona un conjunto uniforme de verbos que nos ayudan en el preprocesamiento de grandes datos. La función group_by() agrupa los datos usando una o más variables y luego la función de resumen crea el resumen de los datos por esos grupos usando la función agregada que se le pasa.

Sintaxis:

df %>% group_by( grouping_variables) %>% resume( label = added_fun() )

Parámetro:

  • df: determina el marco de datos en uso.
  • grouping_variables: determina la variable utilizada para agrupar datos.
  • added_fun(): determina la función utilizada para el resumen. por ejemplo, suma, media, etc.

Ejemplo 1: crear tablas dinámicas

R

# create sample data frame
sample_data <- data.frame(label=c('Geek1', 'Geek2', 'Geek3', 'Geek1', 
                                  'Geek2', 'Geek3', 'Geek1', 'Geek2',
                                  'Geek3'),
                             value=c(222, 18, 51, 52, 44, 19, 100, 98, 34))
  
# load library dplyr
library(dplyr)
  
# create pivot table with sum of value as summary
sample_data %>% group_by(label) %>% 
summarize(sum_values = sum(value))

Producción:

# A tibble: 3 x 2
 label sum_values
 <chr>      <dbl>
1 Geek1        374
2 Geek2        160
3 Geek3        104

Ejemplo 2: crear una tabla dinámica

R

# create sample data frame
sample_data <- data.frame(label=c('Geek1', 'Geek2', 'Geek3', 'Geek1', 
                                  'Geek2', 'Geek3', 'Geek1', 'Geek2',
                                  'Geek3'),
                             value=c(222, 18, 51, 52, 44, 19, 100, 98, 34))
  
# load library dplyr
library(dplyr)
  
# create pivot table with sum of value as summary
sample_data %>% group_by(label) %>% summarize(average_values = mean(value))

Producción:

# A tibble: 3 x 2
 label average_values
 <chr>          <dbl>
1 Geek1          125.  
2 Geek2           53.3
3 Geek3           34.7

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *