En este artículo, discutiremos cómo hacer un diagrama de caja agrupado en el lenguaje de programación R usando el paquete ggplot2.
Boxplot nos ayuda a visualizar la distribución de datos cuantitativos comparando diferentes variables continuas o categóricas. Los diagramas de caja consisten en un resumen de cinco números que ayuda a detectar y eliminar valores atípicos del conjunto de datos. Estos cinco números de resumen son mínimo, primer cuartil, mediana, tercer cuartil y máximo.
Los diagramas de caja agrupados se utilizan para visualizar los datos que tienen múltiples subgrupos. Además, podemos visualizar tres variables a la vez con diagramas de caja agrupados donde una variable es numérica y las otras dos son variables categóricas. Podemos visualizar la cuarta variable usando la propiedad de color de ggplot en R.
Primero, para hacer un diagrama de caja básico en R usando el paquete ggplot2, usamos la función geom_boxplot() en el lenguaje R.
Sintaxis:
ggplot(marco de datos, aes(x, y)) + geom_boxplot()
Ejemplo:
Aquí hay un diagrama de caja básico hecho usando la función geom_boxplot del paquete ggplot2.
R
# load library ggplot library(ggplot2) # Plot boxplot using ggplot function # diamonds dataset used here is inbuilt in the R Language plot <- ggplot(diamonds, aes(x=factor(cut), y=carat))+ geom_boxplot()+ theme( legend.position = "none" ) # print boxplot plot
Producción:
Crear diagrama de caja agrupado
Para convertir este diagrama de caja básico en un diagrama de caja agrupado, usamos la propiedad de color de la función aes() del paquete ggplot2. Aquí, usamos una tercera variable como el valor del color del argumento para convertir un diagrama de caja básico en un diagrama de caja agrupado.
Sintaxis:
ggplot(marco de datos, aes(x, y, color = z)) + geom_boxplot()
Parámetros :
- x es la primera variable categórica
- y es una variable cuantitativa
- z es la segunda variable categórica.
Ejemplo:
Aquí hay un diagrama de caja agrupado por color variable en ggplot2. El conjunto de datos de diamantes utilizado en el ejemplo está prediseñado en lenguaje R.
R
# load library ggplot library(ggplot2) # Plot boxplot using ggplot function # diamonds dataset used here is inbuilt in the R Language plot <- ggplot(diamonds, aes(x=factor(cut), y=carat, color = factor(color)))+ geom_boxplot()+ theme( legend.position = "none" ) # print boxplot plot
Producción:
Diagramas de caja agrupados con facetas
Hay una forma más de hacer un diagrama de caja agrupado en el lenguaje R usando el paquete ggplot2. Es para usar faceta en ggplot. Las funciones de facetado en ggplot2 ofrecen una solución general para dividir los datos por una o más variables y hacer gráficos con subconjuntos de datos juntos. Para crear un diagrama de caja agrupado, podemos usar la función facet_wrap().
Sintaxis:
ggplot(marco de datos, aes(x, y)) + geom_boxplot() + facet_wrap(~z)
Parámetros :
- x es la primera variable categórica
- y es una variable cuantitativa
- z es la segunda variable categórica
Ejemplo:
Aquí, hay un gráfico de caja agrupado por color variable en ggplot2 usando la función facet_wrap(). El conjunto de datos de diamantes que se usa en el ejemplo está preconstruido en R Language. También hemos coloreado el gráfico usando la variable de corte como valor para el argumento de color en la función ggplot().
R
# load library ggplot library(ggplot2) # Plot boxplot using ggplot function # diamonds dataset used here is inbuilt in the R Language plot <- ggplot(diamonds, aes(x=factor(cut), y=carat, color=factor(cut) ))+ geom_boxplot()+ theme( legend.position = "none" )+ facet_wrap(~color, ncol=3) # print boxplot plot
Producción:
Publicación traducida automáticamente
Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA