Diagrama de barras agrupado, apilado y porcentualmente apilado en ggplot2

El ggplot es una biblioteca utilizada para generar gráficos en lenguaje R. Proporcionamos los datos y especificamos la estética en cuanto a cómo se deben mapear los datos especificados. Es una biblioteca muy poderosa y ampliamente utilizada para generar gráficos y diagramas completos. Se utiliza para crear gráficos basados ​​en la “Gramática de los Gráficos”.

Un diagrama de barras o gráfico de barras es una herramienta de visualización de datos que se usa ampliamente para representar la relación entre una variable numérica y categórica. La variable numérica generalmente se representa en el eje Y y la variable categórica en el eje X horizontal. La altura de las barras representa el valor numérico correspondiente del valor categórico. Lo anterior viene bien cuando tenemos más de una variable categórica y una variable numérica.

En este artículo, veremos cómo podemos trazar 3 tipos diferentes de gráficos de barras. Estos 3 tipos diferentes de diagramas de barras son:

  • Gráfica de barras agrupadas
  • Gráfico de barras apiladas
  • Gráfica de barras apiladas porcentuales

La única diferencia en los códigos de los 3 gráficos es el valor del parámetro «posición» en la función geom_bar() de la biblioteca ggplot. A continuación se muestra la implementación de la misma.

Ejemplo :

R

# importing the ggplot2 library
library(ggplot2)
  
# creating the cities column
# c() is used to combine vectors
# rep() is used for replication of values
cities <- c(rep("Delhi", 3), rep("Mumbai", 3),
            rep("Chennai", 3), rep("Bengaluru", 3))
  
# creating the humidity column
# contains 3 classes 
humidity <- rep(c("High", "Medium", "Low"), 4)
  
# creating the temperature column
# abs() is used for getting the absolute value
# rnorm() is used for generating random variates
# in a normal distribution
# rnorm(number of samples, mean, SD)
temperature <- abs(rnorm(12, 25, 10))
  
# dataframe consisting of the three columns
dataframe <- data.frame(cities, humidity,
                        temperature)
  
# calling the dataframe
dataframe

Gráficas de barras agrupadas

Los diagramas de barras agrupadas o los diagramas de barras agrupadas se utilizan para ampliar las funcionalidades de un diagrama de barras de una sola variable o de una sola categoría a un diagrama de barras de múltiples variables. En estos gráficos, las barras se agrupan según sus categorías y los colores son el factor diferenciador para representar la otra variable categórica. Las barras se colocan para atender a un grupo o al grupo principal y los colores representan la categoría secundaria. Para diagramas de barras agrupadas, el valor del parámetro de posición se especifica como «sobreexponer» .

Acercarse:

  • Módulo de importación
  • Crear marco de datos
  • Trazar gráfico con funciones requeridas
  • Establecer el parámetro de posición para esquivar en la función geom_bar()
  • Gráfico de visualización

Sintaxis:

geom_bar(posición = “esquivar”, ….)

Ejemplo:

R

# importing the ggplot2 library
library(ggplot2)
  
# creating data frame
cities <- c(rep("Delhi", 3), rep("Mumbai", 3),
            rep("Chennai", 3), rep("Bengaluru", 3))
   
humidity <- rep(c("High", "Medium", "Low"), 4)
  
temperature <- abs(rnorm(12, 25, 10))
  
dataframe <- data.frame(cities, humidity,
                        temperature)
  
# calling the dataframe
dataframe
  
# plotting the graph
ggplot(dataframe, aes(fill = humidity,
                      y = temperature, x = cities))+
geom_bar(position = "dodge", stat = "identity")+
ggtitle("Weather Data of 4 Cities !")+
theme(plot.title = element_text(hjust = 0.5))

Producción:

Gráfica de barras agrupadas para el conjunto de datos meteorológicos 

Gráficos de barras apiladas

Los diagramas de barras apiladas o los gráficos de barras apiladas son una extensión de los diagramas de barras estándar en los que podemos representar dos variables categóricas con la ayuda de un solo diagrama de barras. En estos gráficos, las barras de la variable categórica primaria determinan la posición y los distintos niveles de la variable categórica secundaria que se diferencian en función de sus colores se apilan uno encima del otro. Para gráficos de barras apiladas, el valor del parámetro de posición se especifica como «pila».

Acercarse:

  • Módulo de importación
  • Crear marco de datos
  • Trazar gráfico con funciones requeridas
  • Establecer el parámetro de posición para apilar en la función geom_bar()
  • Gráfico de visualización

Sintaxis:

geom_bar(posición = “pila”, …)

Ejemplo:

R

# importing the ggplot2 library
library(ggplot2)
  
# creating data frame
cities <- c(rep("Delhi", 3), rep("Mumbai", 3),
            rep("Chennai", 3), rep("Bengaluru", 3))
  
humidity <- rep(c("High", "Medium", "Low"), 4)
  
temperature <- abs(rnorm(12, 25, 10))
  
dataframe <- data.frame(cities, humidity,
                        temperature)
  
# calling the dataframe
dataframe
  
# plotting graph
ggplot(dataframe, aes(fill = humidity,
                      y = temperature, x = cities))+
geom_bar(position = "stack", stat = "identity")+
ggtitle("Weather Data of 4 Cities !")+
theme(plot.title = element_text(hjust = 0.5))

Producción:

Gráfica de barras apiladas del conjunto de datos meteorológicos

Gráficas de porcentaje de barras apiladas

Los diagramas de barras apiladas de porcentaje se utilizan para visualizar la contribución o proporción de cada variable categórica mientras se toma de forma acumulativa la variable categórica principal. Toda la barra se llena hasta arriba y los diferentes grupos ocupan las alturas correspondientes a su proporción en la barra. Para mapear un gráfico de barras apiladas porcentuales, el valor del parámetro de posición se especifica como “relleno” .

Acercarse:

  • Módulo de importación
  • Crear marco de datos
  • Trazar gráfico con funciones requeridas
  • Establezca el parámetro de posición para completar la función geom_bar()
  • Gráfico de visualización

Sintaxis:

geom_bar(posición = “rellenar”, ….)

Ejemplo:

R

# importing the ggplot2 library
library(ggplot2)
  
# creating data frame
cities <- c(rep("Delhi", 3), rep("Mumbai", 3),
            rep("Chennai", 3), rep("Bengaluru", 3))
  
humidity <- rep(c("High", "Medium", "Low"), 4)
  
temperature <- abs(rnorm(12, 25, 10))
  
dataframe <- data.frame(cities, humidity,
                        temperature)
  
# calling the dataframe
dataframe
  
# plotting graph
ggplot(dataframe, aes(fill = humidity,
                      y = temperature, x = cities))+
geom_bar(position = "fill", stat = "identity")+
ggtitle("Weather Data of 4 Cities !")+
theme(plot.title = element_text(hjust = 0.5))

Producción :

Gráfica de barras apiladas porcentuales del conjunto de datos meteorológicos

Publicación traducida automáticamente

Artículo escrito por ag01harshit y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *