Histograma en R usando ggplot2

ggplot2 es un paquete R dedicado a la visualización de datos. Paquete ggplot2 Mejora la calidad y la belleza (estética) del gráfico. Usando ggplot2 podemos hacer casi cualquier tipo de gráfico en RStudio

Un histograma es una representación aproximada de la distribución de datos numéricos. En un histograma, cada barra agrupa números en rangos. Las barras más altas muestran que hay más datos en ese rango. Un histograma muestra la forma y la dispersión de datos de muestra continuos.

Los histogramas nos dan una idea aproximada de la distribución de probabilidad de una variable dada al representar las frecuencias de las observaciones que ocurren en ciertos rangos de valores. Básicamente, los histogramas se usan para mostrar distribuciones de una variable determinada, mientras que los gráficos de barras se usan para comparar variables. Los histogramas trazan datos cuantitativos con rangos de datos agrupados en intervalos, mientras que los gráficos de barras trazan datos categóricos.

La función geom_histogram() es una función incorporada del módulo ggplot2.

Acercarse

  • Módulo de importación
  • Crear marco de datos
  • Crear histograma usando la función
  • Gráfico de visualización

Ejemplo 1:

R

set.seed(123)
  
# In the above line,123 is set as the 
# random number value
# The main point of using the seed is to
# be able to reproduce a particular sequence 
# of 'random' numbers. and sed(n) reproduces
# random numbers results by seed
df <- data.frame(
   gender=factor(rep(c(
     "Average Female income ", "Average Male incmome"), each=20000)),
   Average_income=round(c(rnorm(20000, mean=15500, sd=500), 
                          rnorm(20000, mean=17500, sd=600)))   
)  
head(df)
  
# if already installed ggplot2 then use library(ggplot2)
library(ggplot2)
  
# Basic histogram
ggplot(df, aes(x=Average_income)) + geom_histogram()
  
# Change the width of bins
ggplot(df, aes(x=Average_income)) +    
  
   geom_histogram(binwidth=1)
  
# Change colors
p<-ggplot(df, aes(x=Average_income)) +   
  
   geom_histogram(color="white", fill="red")
p

Producción : 

Ejemplo 2:

R

plot_hist <- ggplot(airquality, aes(x = Ozone)) +
  
   # binwidth help to change the thickness (Width) of the bar 
   geom_histogram(aes(fill = ..count..), binwidth = 10)+
  
   # name = "Mean ozone(03) in ppm parts per million "
   # name is used to give name to axis  
   scale_x_continuous(name = "Mean ozone(03) in ppm parts per million ",
                      breaks = seq(0, 200, 25),
                      limits=c(0, 200)) +
   scale_y_continuous(name = "Count") +
  
   # ggtitle is used to give name to a chart
   ggtitle("Frequency of mean ozone(03)") +
   scale_fill_gradient("Count", low = "green", high = "red")
  
plot_hist

Producción : 

Publicación traducida automáticamente

Artículo escrito por ankitkhandewal2018 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *