¿Cómo agregar la media y la mediana al histograma en R?

La visualización de datos puede ayudar a recopilar información que las estadísticas descriptivas no pueden. El Cuarteto de Anscombe nos muestra cómo esas estadísticas pueden ser engañosas, por lo que se vuelve a analizar los datos visualmente. Los histogramas son una forma de visualizar la distribución de datos de una variable continua. Los histogramas son similares a los gráficos de barras, pero los gráficos de barras visualizan datos categóricos y los histogramas visualizan datos continuos. En este artículo, veremos cómo podemos crear histogramas en el lenguaje de programación R y cómo agregarles líneas medias y medianas.

¿Cómo hacer Histogramas?

Antes de aprender el código para crear histogramas, avancemos y entendamos cómo hacerlos. El proceso para crear un histograma es simple, comienza decidiendo un tamaño de contenedor, tomemos el tamaño de contenedor como 5 por ahora. A continuación, encontraremos la frecuencia del no. que se encuentran en los contenedores (0-5, 5-10,10-15, ..). Entonces, si tenemos datos de muestra como [2, 3, 7, 8, 10, 13, 14, 15, 17, 18, 20, 22, 25, 26, 27, 28] y el tamaño del contenedor es 5, entonces obtendremos el siguiente histograma: –

Entendamos la trama anterior. En nuestros datos de muestra, tenemos 2 valores en el rango 0-5, por lo tanto, la barra para 0-5 tiene una altura de 2 unidades en el eje y. De manera similar, tenemos 3 valores en el rango de 5 a 10, por lo tanto, la altura de esa barra es 3. El histograma cambia con el cambio en el tamaño del contenedor. Los mismos datos del tamaño de contenedor 3 darán el siguiente histograma: –

Por lo tanto, es importante establecer el tamaño de contenedor correcto para obtener información valiosa de los datos. Hay muchas fórmulas para encontrar el tamaño de contenedor correcto, como la regla de Sturge, la regla de Rice, la regla de Scott, etc.

Creación de histogramas en R

Los histogramas en R se pueden crear utilizando la función hist(). Todo lo que tiene que hacer es pasar los datos a la función y los trazará por usted. Avancemos y creemos un histograma.

R

l <- c(2, 3, 7, 8, 10, 13, 14, 15,
       18, 18, 20, 26, 25, 26, 27, 28)
hist(l)

Producción:

Adición de media y mediana

Ahora que hemos creado nuestro histograma, vamos a agregarle líneas de media y mediana. Para encontrar las rectas media y mediana de la misma. Pero antes de agregarlos, busquémoslos para encontrar la media y la mediana de los datos en R, podemos usar las funciones mean() y mediana() .

mean <- mean(l)     # Mean: 16.25
med <- median(l)    # Meadian: 16.5

Ahora que tenemos la media y la mediana, agreguemos la media a la gráfica usando la función abline() y establezcamos su color en azul.

abline(v = mean, col = 'blue')

Ejemplo 1: sumar la media al histograma en R

R

l <- c(2, 3, 7, 8, 10, 13, 14, 15,
       18, 18, 20, 26, 25, 26, 27, 28)
  
# Mean of l
mean <- mean(l)
  
# Plotting histogram and Adding
# Mean line to Histogram
hist(l)
abline(v = mean, col = 'blue')

Producción:

Ejemplo 2: Agregar mediana al histograma en R

Agreguemos la mediana a la gráfica usando la función abline() y establezcamos su color como rojo.

abline(v = med, col = 'red')

R

l <- c(2, 3, 7, 8, 10, 13, 14, 15,
       18, 18, 20, 26, 25, 26, 27, 28)
  
# Median of l
med <- median(l)
  
# Plotting histogram and Adding 
# Median line to Histogram
hist(l)
abline(v = med, col = 'red')

Publicación traducida automáticamente

Artículo escrito por herumbshandilya y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *