En este artículo, discutiremos cómo hacer diagramas de caja con texto como puntos usando el paquete ggplot2 en el lenguaje de programación R.
Un diagrama de caja es un gráfico que muestra datos de un resumen de cinco números que incluye una de las medidas de tendencia central. Estos cinco números de resumen son Mínimo, Primer cuartil, Mediana, Tercer cuartil y Máximo, lo que nos ayuda a analizar diferentes medidas estadísticas a través de la representación visual.
Para importar e instalar el paquete ggplot2, debemos seguir la siguiente sintaxis:
install.package('ggplot2') # To install import('ggplot2') # To import
Crear diagrama de caja básico
Podemos crear un diagrama de caja básico usando la función geom_boxplot() del paquete ggplot2 en el lenguaje R.
Sintaxis:
ggplot(dataframe, aes( x, y, color ) ) + geom_boxplot()
Ejemplo:
En este ejemplo, se crea un diagrama de caja básico usando la función geom_boxplot del paquete ggplot2.
El archivo CSV utilizado en el ejemplo se puede descargar aquí .
R
# Load library ggplot2 library(ggplot2) # read sample_data from csv as a dataframe sample_data <- read.csv("df.csv") # use sample_data to plot a boxplot # Color the plot by group using color parameter ggplot(sample_data, aes(x=group, y=value, color=group))+ geom_boxplot()
Producción:
Adición de puntos de datos como superposición:
Para agregar puntos de datos fluctuantes como una superposición al diagrama de caja, usaremos la función geom_jitter() del paquete ggplot2. Esta función agrega una capa sobre el diagrama de caja con puntos reales trazados sobre él.
Sintaxis:
ggplot(marco de datos, aes(x, y, color)) + geom_boxplot() + geom_jitter()
Parámetros:
- x es una variable categórica
- y es una variable cuantitativa
- z es la variable categórica utilizada en el diagrama de color por el grupo.
Ejemplo:
En este ejemplo, se crea un diagrama de caja utilizando la función geom_boxplot del paquete ggplot2. Los puntos de datos reales se superponen al gráfico de caja utilizando la función geom_jitter().
R
# Load library ggplot2 library(ggplot2) # read sample_data from csv as a dataframe sample_data <- read.csv("df.csv") # use sample_data to plot a boxplot # Add jitter points to boxplot using # geom_jitter() function ggplot(sample_data, aes(x=group, y=value, color=group))+ geom_boxplot()+ geom_jitter()
Producción:
Sustitución de puntos de datos con etiquetas
Ahora para analizar los datos reemplazaremos los puntos de datos con sus respectivas etiquetas usando la función geom_text() con posición de parámetro. La función geom_text() reemplaza los puntos de datos con etiquetas de datos pero todas las etiquetas vienen en línea recta. Para hacerlo vibrar, usamos el parámetro de posición como position_jitter().
Sintaxis:
ggplot(marco de datos, aes( x, y, color ) ) + geom_boxplot() + geom_text( position= position_jitter() )
Ejemplo:
Aquí, los puntos de datos reales se superponen al gráfico de caja como el texto de la etiqueta usando la función geom_text().
R
# Load library tidyverse library(tidyverse) # read sample_data from csv as a dataframe sample_data <- read.csv("df.csv") # use sample_data to plot a boxplot # Add jitter points to boxplot using geom_jitter() # function ggplot(sample_data, aes(x=group,y=value, label = Label, color=group))+ geom_boxplot()+ geom_text(check_overlap = TRUE, position=position_jitter(width=0.15))
Producción:
Publicación traducida automáticamente
Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA