Un gráfico de caja es un gráfico que se utiliza para mostrar información en forma de distribución dibujando diagramas de caja para cada uno de ellos. Esta distribución de datos se basa en cinco conjuntos (mínimo, primer cuartil, mediana, tercer cuartil, máximo).
Diagramas de caja en lenguaje de programación R
Los diagramas de caja se crean en R usando la función boxplot() .
Sintaxis: boxplot(x, data, notch, varwidth, names, main)
Parámetros:
- x: Este parámetro se establece como un vector o una fórmula.
- datos: este parámetro establece el marco de datos.
- muesca: Este parámetro es la etiqueta para el eje horizontal.
- varwidth: este parámetro es un valor lógico. Establecer como verdadero para dibujar el ancho del cuadro proporcional al tamaño de la muestra.
- main: este parámetro es el título del gráfico.
- nombres: este parámetro son las etiquetas de grupo que se mostrarán debajo de cada diagrama de caja.
Creación de un conjunto de datos
Para entender cómo podemos crear un diagrama de caja:
- Utilizamos el conjunto de datos «mtcars».
- Miremos las columnas “mpg” y “cyl” en mtcars.
R
input <- mtcars[, c('mpg', 'cyl')] print(head(input))
Producción:
Crear el diagrama de caja
Creación del gráfico Boxplot.
- Tome los parámetros que se requieren para hacer boxplot.
- Ahora dibujamos un gráfico para la relación entre «mpg» y «cyl».
R
# Plot the chart. boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders", ylab = "Miles Per Gallon", main = "Mileage Data")
Producción:
Diagrama de caja múltiple
Aquí estamos creando múltiples diagramas de caja. Los datos individuales para los que se requiere una representación de diagrama de caja se basan en la función.
R
set.seed(20000) data <- data.frame( A = rpois(900, 3), B = rnorm(900), C = runif(900) ) # Applying boxplot function boxplot(data)
Producción:
Diagrama de caja usando muesca
Para dibujar un diagrama de caja usando una muesca:
- Con la ayuda de notch, podemos averiguar cómo coinciden las medianas de diferentes grupos de datos.
- Estamos usando xlab como «Cantidad de cilindros» e ylab como «Millas por galón».
Python3
# Plot the chart. boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders", ylab = "Miles Per Gallon", main = "Mileage Data", notch = TRUE, varwidth = TRUE, col = c("green", "red", "blue"), names = c("High", "Medium", "Low") )
Producción:
Publicación traducida automáticamente
Artículo escrito por shivanisinghss2110 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA