Las distribuciones de múltiples variables se pueden visualizar con diagramas de caja. ggplot2 nos permite crear hermosas gráficas de caja rápidamente. Es posible tener múltiples subgrupos para una variable de interés. En esas situaciones, es muy útil visualizar usando “diagramas de caja agrupados”. El paquete ggplot2 en el lenguaje de programación R proporciona una serie de opciones para visualizar diagramas de caja agrupados.
Ahora hablando de Boxplot, cada boxplot se crea para cada categoría o nivel en ese factor que está representado por un factor y una columna numérica. geom_boxplot también nos permite graficar ambos factores usando el argumento de relleno cuando hay dos factores. Geom_boxplot() es la función clave
Sintaxis :
geom_boxplot(ancho,muesca,color,tamaño,tipo de línea, relleno,delineador.color, delineador.tamaño, delineador.forma)
Parámetro:
- ancho: ancho del diagrama de caja
- muesca: si es cierto, creará un diagrama de caja con muescas y las muescas se usan para comparar diagramas de caja.
- color, tamaño, tipo de línea: límite, color, tamaño y forma.
- relleno: se utiliza para rellenar áreas de diagramas de caja.
- outlier.colour, outlier.shape, outlier.size: el color, la forma y el tamaño de los puntos periféricos.
Ahora veamos algunas implementaciones.
Ejemplo 1:
R
# create a Data Frame Gender<-sample(c("Male","Female"),20,replace=TRUE) Values<-rnorm(20,mean=0,sd=1) Group<-sample(letters[1:5],20,replace=TRUE) df<-data.frame(Gender,Values,Group) library(ggplot2) # creating a boxplot ggplot(df,aes(Gender,Values))+geom_boxplot(aes(fill=Group))
Producción:
Ejemplo 2:
R
# load ggplot2 package if already installed library(ggplot2) # create a data frame with two factors df <- data.frame(Factor1=factor(rbinom(30, 1, 0.55), label=c("male","female")), Factor2=factor(rbinom(30, 1, 0.45), label=c("young","old")), Values=rnorm(30,mean=5,sd=2)) # Now make a interaction between two factors # on x axis df$Factor1Factor2 <- interaction(df$Factor1, df$Factor2) # now Plot Boxplot with fill color according # to factor1 and factor2 ggplot(aes(y = Values, x = Factor1Factor2), data = df) + geom_boxplot(aes(fill=Factor1Factor2))
Producción: