¿Cómo crear un diagrama de caja usando ggplot2 sin bigotes en R?

Un diagrama de caja es un método para representar el grupo de datos numéricos en forma de cuartiles. Los cuartiles son los valores en un percentil particular en todo el conjunto de datos. Los diagramas de caja indican el resumen de cinco números del conjunto de datos. El resumen de cinco números tiene el valor de los datos como mínimo, primer cuartil, segundo cuartil (mediana), tercer cuartil y máximo.   

Como se muestra en la imagen de arriba, un diagrama de caja también tiene bigotes desde el primer cuartil hasta el mínimo y desde el tercer cuartil hasta el máximo. Este artículo se enfoca en mostrar un diagrama de caja sin bigotes.

Componentes de Boxplot

  • Mínimo: el valor más bajo en el conjunto de datos, excluyendo los valores atípicos.
  • Primer cuartil (Q1): el valor en el conjunto de datos en el percentil 25.
  • Segundo cuartil (Q2): el valor en el conjunto de datos en el percentil 50. También se conoce como la mediana de los datos.
  • Tercer cuartil (Q3): el valor en el conjunto de datos en el percentil 75.
  • Máximo: el valor más alto en el conjunto de datos, excluyendo los valores atípicos.
  • Rango intercuartil (IQR): la distancia entre el primer cuartil (Q1) y el tercer cuartil (Q3). IQR se define de la siguiente manera: RIC = Q3 - Q1
  • Bigotes: Las líneas que se muestran arriba desde el mínimo hasta Q1 y Q3 hasta el máximo son bigotes.
  • Valores atípicos: Cualquier valor menor que el mínimo y mayor que el máximo son los valores atípicos de los datos.

Función utilizada:

Sintaxis: boxplot(x, data, notch, varwidth, names, main)

Parámetros:

  • x: Este parámetro se establece como un vector o una fórmula.
  • datos: este parámetro establece el marco de datos.
  • muesca: Este parámetro es la etiqueta para el eje horizontal.
  • varwidth: este parámetro es un valor lógico. Establecer como verdadero para dibujar el ancho del cuadro proporcional al tamaño de la muestra.
  • main: este parámetro es el título del gráfico.
  • nombres: este parámetro son las etiquetas de grupo que se mostrarán debajo de cada diagrama de caja.

Programa 1: Diagrama de caja regular

R

x <- 1:20
y <- sample(1000,20, replace = TRUE)
  
df <- data.frame(x,y)
library(ggplot2)
  
ggplot(df, aes(x,y, group =1))+geom_boxplot()

  

Producción :

Diagrama de caja con bigotes

Ahora, para crear el mismo gráfico sin bigotes, el parámetro coef de la función geom_boxplot() debe establecerse en 0. Aquí, el parámetro coef es la longitud de los bigotes como el múltiplo de IQR. El valor por defecto es 1,5 pero aquí lo hemos puesto a 0. Así, se eliminan los bigotes.

Acercarse

  • Importar biblioteca
  • Crear datos
  • Crear marco de datos
  • Parcela bolblot sin bigotes

Programa 2:

R

x <- 1:20
y <- sample(1000,20, replace = TRUE)
  
df <- data.frame(x,y)
library(ggplot2)
  
ggplot(df,aes(x,y, group =1))+geom_boxplot(coef=0)

Producción :

Diagrama de caja sin bigotes

Publicación traducida automáticamente

Artículo escrito por mahishapatel y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *