Trazar distribución normal sobre histograma en R

En este artículo, discutiremos cómo trazar una distribución normal sobre un histograma en el lenguaje de programación R.

En un conjunto de datos aleatorio, generalmente se observa que la distribución de los datos es normal, es decir, en su visualización utilizando un gráfico de densidad con el valor de la variable en el eje x y el eje y obtenemos una curva en forma de campana. El centro de esa curva representa la media del conjunto de datos. Pero el gráfico de densidad, aunque es uniforme, no muestra los valores reales, sino que muestra la distribución normal. Para abordar esa situación, usamos un histograma con una superposición de distribución normal. En este escenario, el histograma proporciona los valores reales de las barras graficadas y el gráfico de densidad de superposición muestra las tendencias de distribución normal.

 Para hacerlo usamos la función plotNormalHistogram() del paquete rcompanion. Esta función toma el vector de datos como argumento y traza un histograma con el gráfico de densidad de mejor ajuste como una superposición.

Instalación

Para instalar el paquete rcompanion:

install.packages("rcompanion") 

Histograma con superposición de distribución normal

Para crear un histograma básico con una superposición de distribución normal del diagrama de densidad, usamos la función plotNormalHistogram() de la biblioteca del paquete rcompanion en el lenguaje R.

Sintaxis:

plotNormalHistogram(x, prob, col, main, length)

Parámetros:

  • x: determina el vector de datos para la trama
  • prob: Es un valor booleano. Si es FALSO, se muestran los recuentos; de lo contrario, se muestra la densidad.
  • main: determina el título de visualización para el gráfico.
  • longitud: determina el número de puntos en la línea de trama de densidad.

Ejemplo:

Aquí hay un histograma básico con una superposición de distribución normal.

R

# load library rcompanion
library(rcompanion)
  
# create data vector
x= c(rnorm(10000))
  
# draw plot
plotNormalHistogram( x, prob = FALSE,
                      main = "Normal Distribution overlay on Histogram",
                      length = 1000 )

Producción:

Personalización de color y tamaño.

Podemos personalizar la apariencia del gráfico anterior según nuestras necesidades usando los argumentos col, linecol, lwd y border para cambiar el color de las barras del histograma, el color de la línea del gráfico de densidad, el ancho del gráfico de densidad línea, y el color del borde de las barras del histograma respectivamente. Dado que la función plotNormalHistogram() está construida sobre la función hist(), todos los argumentos de la función hist() también funcionan aquí.

Sintaxis:

plotNormalHistogram(x, col, linecol, lwd, border)

Parámetros

  • col: Determina el color de las barras del histograma.
  • linecol: determina el color de la línea de trama de densidad.
  • lwd: determina el ancho de la línea del gráfico de densidad.
  • borde: Determina el color del borde de las barras del histograma.

Ejemplo:

Aquí, hay un histograma con superposición de distribución normal con barras negras con un borde verde y una trama de densidad gruesa roja.

R

# load library rcompanion
library(rcompanion)
  
# create data vector
x= c(rnorm(10000, 2000, 45))
  
# draw plot using plotNormalHistogram() function
# use colour and size arguments for formatting plot
plotNormalHistogram( x, prob = FALSE, col="black", border="green",
                      main = "Normal Distribution overlay on Histogram",
                      length = 10000, linecol="red", lwd=3 )

Producción:

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *