¿Cómo hacer un diagrama de caja con una línea que conecta los valores medios en R?

Los diagramas de caja son una buena manera de resumir la forma de una distribución, mostrando su mediana, su media, la asimetría, posibles valores atípicos, su dispersión, etc. Estos diagramas son el mejor método para la exploración de datos. El diagrama de caja es el resumen de cinco números, que incluye el mínimo, el primer cuartil, la mediana, el tercer cuartil y el máximo. 

En este artículo, discutiremos cómo hacer un diagrama de caja con una línea que conecta los valores medios en el lenguaje de programación R.

Para crear un diagrama de caja con una línea que conecta los valores medios en R, usamos el enfoque de superposición de ggplot2. Primero creamos el diagrama de caja simple ggplot2. Luego tomamos los valores medios de los valores de datos del marco de datos y los almacenamos en la media vectorial. Luego, al usar la función vector mean y geom_line() de ggplot2, superponemos un diagrama de líneas a un diagrama de caja que replica el efecto de los valores medios de una conexión de línea.

Sintaxis:

 ggplot() + geom_boxplot() + geom_line()

Ejemplo: programa R para crear un diagrama de caja con una línea que conecta los valores medios

R

# import library tidyverse
library(tidyverse)
  
# set seed and create a dataframe
set.seed(1068)
  
df <- data.frame(grp = paste0("geeks", 
                             rep(1:7, each = 56)),
                 values = c(rnorm(56, 7, 20), 
                               rnorm(56, 14, 40),
                               rnorm(56, 28, 60),
                               rnorm(56, 56, 100),
                               rnorm(56, 63, 60),
                            rnorm(56, 63, 60),
                            rnorm(56, 63, 60)))
  
# Get mean of data values from data frame 
mean <- df %>% 
  group_by(grp) %>% 
  summarize(average = mean(values)) %>%
  ungroup()
  
# Create Boxplot with a line plot using mean values
df %>% 
  ggplot(mapping = aes(x = grp, y = values)) + 
  geom_boxplot() +
  geom_line(data = mean, 
            mapping = aes(x = grp, y = average, group=1),color="green")

Producción:

Ejemplo: programa R para crear un diagrama de caja con una línea que conecta los valores medios

R

# import library tidyverse
library(tidyverse)
  
# set seed and create a dataframe
set.seed(1068)
  
df <- data.frame(grp = paste0("Students", 
                             rep(1:4, each = 40)),
                 values = c(rnorm(40, 100, 122), 
                               rnorm(40, 14, 21),
                               rnorm(40, 28, 93),
                               rnorm(40, 52, 100)))
  
# Get mean of data values from data frame 
mean <- df %>% 
  group_by(grp) %>% 
  summarize(average = mean(values)) %>%
  ungroup()
  
# Create Boxplot with a line plot using mean values
df %>% 
  ggplot(mapping = aes(x = grp, y = values)) + 
  geom_boxplot() +
  geom_line(data = mean,mapping = aes(x = grp, y = average, group=1),
            color="red", size=1.4)+
  coord_flip()

Producción:

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *