Los diagramas de violín nos ayudan a visualizar variables numéricas de una o más categorías. Son similares a los diagramas de caja en la forma en que muestran una distribución numérica utilizando cinco estadísticas de nivel de resumen. Pero los diagramas de violín también tienen la información de densidad de las variables numéricas. Permite visualizar la distribución de varias categorías mostrando sus densidades.
En este artículo, discutiremos cómo trazar un diagrama de violín con la ayuda de la biblioteca ggplot2 en el lenguaje de programación R. Para trazar un diagrama de violín usando el paquete ggplot2 usamos la función geom_violin().
Sintaxis: ggplot(marco de datos, aes(x, y, relleno, color)) + geom_violin()
Parámetros:
- marco de datos: determina el conjunto de datos utilizado en el gráfico.
- relleno: determina el color de fondo del interior de la trama.
- color: determina el color del límite de la parcela.
Creación de tramas de violín básicas
Aquí hay un diagrama básico de violín hecho usando la función geom_violin(). Hemos utilizado el marco de datos de diamantes en este gráfico que proporciona el lenguaje R de forma nativa.
R
# load library ggplot2 library(ggplot2) # Basic violin plot # diamonds dataframe has been used here # diamonds dataframe is provided by R language natively. ggplot(diamonds, aes(x=cut, y=price)) + # geom_violin() function is used to plow violin plot geom_violin()
Producción:
Personalización de color
Podemos cambiar el color de la trama del violín usando el parámetro de color de la función aes() de ggplot2. Esto cambia el color del límite del diagrama de violín según la categoría de datos. Aquí, las parcelas se colorean de acuerdo con la categoría de su corte al poner corte como color de parámetro.
R
# load library ggplot2 library(ggplot2) # Basic violin plot # diamonds dataframe has been used here # diamonds dataframe is provided by R language natively # color parameter is used to color the boundary of # plot according to category ggplot(diamonds, aes(x=cut, y=price, color=cut)) + # geom_violin() function is used to plow violin plot geom_violin()
Producción:
Podemos cambiar el color de fondo de la trama del violín usando el parámetro de relleno de la función aes() de ggplot2. Esto cambia el color del fondo del interior de la trama del violín según la categoría de datos.
Aquí, las parcelas se colorean de acuerdo con la categoría de su corte colocando corte como parámetro de relleno.
R
# load library ggplot2 library(ggplot2) # Basic violin plot # diamonds dataframe has been used here # diamonds dataframe is provided by R language natively # fill parameter is used to color the background of #plot according to category ggplot(diamonds, aes(x=cut, y=price, fill=cut)) + # geom_violin() function is used to plow violin plot geom_violin()
Producción:
Parcela de violín horizontal
Para convertir un diagrama de violín normal en un diagrama de violín horizontal, agregamos la función coord_flip() a la función ggplot(). Esto voltea el eje de coordenadas de la gráfica y convierte cualquier gráfica ggplot2 en una gráfica horizontal.
Sintaxis: plot+ coord_flip()
Aquí, hay un diagrama de violín horizontal hecho usando la función coord_flip().
R
# load library ggplot2 library(ggplot2) # Horizontal violin plot # diamonds dataframe has been used here # diamonds dataframe is provided by R language natively. ggplot(diamonds, aes(x=cut, y=price)) + # geom_violin() function is used to plow violin plot geom_violin()+ # coord_flip() function is used to make horizontal # violin plot coord_flip()
Producción:
Personalización del marcador medio
En ggplot2, usamos la función stat_summary() para calcular nuevas estadísticas de resumen y agregarlas a la gráfica. Usamos la función stat_summary() con la función ggplot().
Sintaxis:
plot+ stat_summary(fun.y, geom, tamaño, color)
Aquí,
- fun.y: determina la función según qué marcador debe colocarse, es decir, media, mediana, etc.
- geom: determina la forma del marcador
- tamaño: determina el tamaño del marcador
- color: determina el color del marcador
Ejemplo:
En este ejemplo, calcularemos el valor medio de la variable del eje y usando el argumento fun.y en la función stat_summary().
R
# load library ggplot2 library(ggplot2) # Basic violin plot # diamonds dataframe has been used here # diamonds dataframe is provided by R # language natively. ggplot(diamonds, aes(x=cut, y=price)) + # geom_violin() function is used to plow violin plot geom_violin()+ # Stat_summary() function adds mean marker on plot stat_summary(fun.y="mean", geom="point", size=2, color="red")
Producción:
Aquí, el punto en el centro del violín muestra la variación de la media del eje y para cada categoría de datos en el eje x.
Publicación traducida automáticamente
Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA