¿Cómo hacer tramas de violín con ggplot2 en R?

Los diagramas de violín nos ayudan a visualizar variables numéricas de una o más categorías. Son similares a los diagramas de caja en la forma en que muestran una distribución numérica utilizando cinco estadísticas de nivel de resumen. Pero los diagramas de violín también tienen la información de densidad de las variables numéricas. Permite visualizar la distribución de varias categorías mostrando sus densidades.

En este artículo, discutiremos cómo trazar un diagrama de violín con la ayuda de la biblioteca ggplot2 en el lenguaje de programación R. Para trazar un diagrama de violín usando el paquete ggplot2 usamos la función geom_violin().

Sintaxis: ggplot(marco de datos, aes(x, y, relleno, color)) + geom_violin()

Parámetros:

  • marco de datos: determina el conjunto de datos utilizado en el gráfico.
  • relleno: determina el color de fondo del interior de la trama.
  • color: determina el color del límite de la parcela.

Creación de tramas de violín básicas

Aquí hay un diagrama básico de violín hecho usando la función geom_violin(). Hemos utilizado el marco de datos de diamantes en este gráfico que proporciona el lenguaje R de forma nativa.

R

# load library ggplot2
library(ggplot2)
 
# Basic violin plot
# diamonds dataframe has been used here
# diamonds dataframe is provided by R language natively.
ggplot(diamonds, aes(x=cut, y=price)) +
 
# geom_violin() function is used to plow violin plot
  geom_violin()

Producción: 

Personalización de color

Podemos cambiar el color de la trama del violín usando el parámetro de color de la función aes() de ggplot2. Esto cambia el color del límite del diagrama de violín según la categoría de datos. Aquí, las parcelas se colorean de acuerdo con la categoría de su corte al poner corte como color de parámetro. 

R

# load library ggplot2
library(ggplot2)
 
# Basic violin plot
# diamonds dataframe has been used here
# diamonds dataframe is provided by R language natively
# color parameter is used to color the boundary of
# plot according to category
ggplot(diamonds, aes(x=cut, y=price, color=cut)) +
 
# geom_violin() function is used to plow violin plot
  geom_violin()

Producción: 

Podemos cambiar el color de fondo de la trama del violín usando el parámetro de relleno de la función aes() de ggplot2. Esto cambia el color del fondo del interior de la trama del violín según la categoría de datos.

Aquí, las parcelas se colorean de acuerdo con la categoría de su corte colocando corte como parámetro de relleno. 

R

# load library ggplot2
library(ggplot2)
 
# Basic violin plot
# diamonds dataframe has been used here
# diamonds dataframe is provided by R language natively
# fill parameter is used to color the background of
#plot according to category
ggplot(diamonds, aes(x=cut, y=price, fill=cut)) +
 
# geom_violin() function is used to plow violin plot
  geom_violin()

 
Producción: 

Parcela de violín horizontal

Para convertir un diagrama de violín normal en un diagrama de violín horizontal, agregamos la función coord_flip() a la función ggplot(). Esto voltea el eje de coordenadas de la gráfica y convierte cualquier gráfica ggplot2 en una gráfica horizontal. 

Sintaxis: plot+ coord_flip()

Aquí, hay un diagrama de violín horizontal hecho usando la función coord_flip(). 

R

# load library ggplot2
library(ggplot2)
 
# Horizontal violin plot
# diamonds dataframe has been used here
# diamonds dataframe is provided by R language natively.
ggplot(diamonds, aes(x=cut, y=price)) +
 
# geom_violin() function is used to plow violin plot
geom_violin()+
 
# coord_flip() function is used to make horizontal
# violin plot
coord_flip()

 
Producción: 

Personalización del marcador medio

En ggplot2, usamos la función stat_summary() para calcular nuevas estadísticas de resumen y agregarlas a la gráfica. Usamos la función stat_summary() con la función ggplot(). 

Sintaxis:

plot+ stat_summary(fun.y, geom, tamaño, color)

Aquí, 

  • fun.y: determina la función según qué marcador debe colocarse, es decir, media, mediana, etc.
  • geom: determina la forma del marcador
  • tamaño: determina el tamaño del marcador
  • color: determina el color del marcador

Ejemplo:

En este ejemplo, calcularemos el valor medio de la variable del eje y usando el argumento fun.y en la función stat_summary(). 

R

# load library ggplot2
library(ggplot2)
 
# Basic violin plot
# diamonds dataframe has been used here
# diamonds dataframe is provided by R
# language natively.
ggplot(diamonds, aes(x=cut, y=price)) +
 
# geom_violin() function is used to plow violin plot
  geom_violin()+
 
# Stat_summary() function adds mean marker on plot
stat_summary(fun.y="mean", geom="point", size=2, color="red")

Producción: 

Aquí, el punto en el centro del violín muestra la variación de la media del eje y para cada categoría de datos en el eje x.

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *