ggplot2 es un paquete R dedicado a la visualización de datos. Paquete ggplot2 Mejora la calidad y la belleza (estética) del gráfico. Usando ggplot2 podemos hacer casi cualquier tipo de gráfico en RStudio
Un histograma es una representación aproximada de la distribución de datos numéricos. En un histograma, cada barra agrupa números en rangos. Las barras más altas muestran que hay más datos en ese rango. Un histograma muestra la forma y la dispersión de datos de muestra continuos.
Los histogramas nos dan una idea aproximada de la distribución de probabilidad de una variable dada al representar las frecuencias de las observaciones que ocurren en ciertos rangos de valores. Básicamente, los histogramas se usan para mostrar distribuciones de una variable determinada, mientras que los gráficos de barras se usan para comparar variables. Los histogramas trazan datos cuantitativos con rangos de datos agrupados en intervalos, mientras que los gráficos de barras trazan datos categóricos.
La función geom_histogram() es una función incorporada del módulo ggplot2.
Acercarse
- Módulo de importación
- Crear marco de datos
- Crear histograma usando la función
- Gráfico de visualización
Ejemplo 1:
R
set.seed(123) # In the above line,123 is set as the # random number value # The main point of using the seed is to # be able to reproduce a particular sequence # of 'random' numbers. and sed(n) reproduces # random numbers results by seed df <- data.frame( gender=factor(rep(c( "Average Female income ", "Average Male incmome"), each=20000)), Average_income=round(c(rnorm(20000, mean=15500, sd=500), rnorm(20000, mean=17500, sd=600))) ) head(df) # if already installed ggplot2 then use library(ggplot2) library(ggplot2) # Basic histogram ggplot(df, aes(x=Average_income)) + geom_histogram() # Change the width of bins ggplot(df, aes(x=Average_income)) + geom_histogram(binwidth=1) # Change colors p<-ggplot(df, aes(x=Average_income)) + geom_histogram(color="white", fill="red") p
Producción :
Ejemplo 2:
R
plot_hist <- ggplot(airquality, aes(x = Ozone)) + # binwidth help to change the thickness (Width) of the bar geom_histogram(aes(fill = ..count..), binwidth = 10)+ # name = "Mean ozone(03) in ppm parts per million " # name is used to give name to axis scale_x_continuous(name = "Mean ozone(03) in ppm parts per million ", breaks = seq(0, 200, 25), limits=c(0, 200)) + scale_y_continuous(name = "Count") + # ggtitle is used to give name to a chart ggtitle("Frequency of mean ozone(03)") + scale_fill_gradient("Count", low = "green", high = "red") plot_hist
Producción :
Publicación traducida automáticamente
Artículo escrito por ankitkhandewal2018 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA