Gráfica de burbujas categóricas en R

Un diagrama de dispersión es una representación gráfica de dos variables numéricas relacionadas entre sí según la premisa del sistema de coordenadas cartesianas en el que se representa un punto en la intersección de las líneas verticales y horizontales imaginarias que se extienden desde los valores de los ejes X e Y. respectivamente. Una de las variables se representa a lo largo del eje X, que suele ser el eje horizontal, y la otra se representa a lo largo de la dirección vertical, normalmente el eje Y. Una mejora del diagrama de dispersión es el diagrama de burbujas, en el que los puntos o puntos tradicionales del diagrama de dispersión se reemplazan por círculos o burbujas. Esto permite representar simultáneamente la introducción de otra variable numérica cuyo valor se mapea correspondiente al tamaño de la burbuja. Por lo tanto, el gráfico de burbujas nos permite mapear tres variables numéricas en el mismo gráfico.

Una extensión adicional o más bien una mejora del gráfico de burbujas es el gráfico de burbujas categóricas en el que podemos representar una variable categórica además de las tres variables numéricas que ya se estaban mapeando en el gráfico de burbujas. El mecanismo de trabajo del gráfico de burbujas categóricas es que la posición de las burbujas está determinada por los valores de dos variables numéricas mapeadas a lo largo de los ejes X e Y. El tamaño de la burbuja está determinado por el valor de la tercera variable numérica. Además de todo esto, el color de la burbuja especifica la categoría a la que pertenece y es como se representa la variable categórica en la misma gráfica. En este artículo, vamos a explorar 2 enfoques para trazar diagramas de burbujas en R. Estos enfoques son los que se mencionan a continuación:

  • usando la biblioteca ggplot2
  • utilizando la biblioteca plotly

Método 1: Usando GGPLOT2 

En este enfoque, usamos la biblioteca ggplot2(), que es una biblioteca muy completa para representar todo tipo de tablas y gráficos. Bajo este enfoque, agregamos dos parámetros adicionales en la función aes() con el nombre de «tamaño», cuyo valor es una variable numérica, y «color», que se usa para representar la variable categórica. La sintaxis y los parámetros necesarios para el gráfico de burbujas con ggplot se mencionan a continuación.

Sintaxis: ggplot(nombre del marco de datos, aes(x = nombre de columna de la primera columna numérica, y = nombre de columna de la segunda variable numérica, tamaño = nombre de columna de la variable para especificar el tamaño, color = nombre de columna de la variable categórica) )

Para especificar el rango de tamaños de las burbujas, usamos:

scale_size(rango = el rango de tamaños de las burbujas, nombre = nombre que se mostrará en la parte superior de la leyenda del tamaño)

Acercarse

  • Crear conjunto de datos
  • Módulo de importación
  • Trazar marco de datos
  • Gráfico de visualización

Programa :

R

# creating data set columns
height <- abs(rnorm(25, 175, 10))
  
weight <- abs(rnorm(25, 72, 10))
  
population <- floor(abs(rnorm(25, 1500, 500)))
  
cities <- c(rep("Delhi", 7), rep("Mumbai", 6),
            rep("Chennai", 6), rep("Bengaluru", 6))
  
# creating the dataframe from the above columns
dataframe <- data.frame(height, weight,
                        population, cities)
  
# importing the ggplot2 library
library(ggplot2)
  
# calling the ggplot function
# the value of the first parameter is the
# name of the dataframe
# the size of the bubbles is proportional to
# the population
# each of the 4 cities is identified by separate
# colors
ggplot(dataframe, aes(x = weight, y = height,
                      size = population,
                      color = cities))+
  
# specifying the transparence of the bubbles
# where value closer to 1 is fully opaque and
# value closer to 0 is completely transparent
geom_point(alpha = 0.7)+
  
# setting the scale of sizes of the bubbles using
# range parameter where the smallest size is 0.1
# and the largest one is 10
# name of the size legend is Population
scale_size(range = c(0.1, 10), name = "Population")+
  
# specifying the title for the plot
ggtitle("Height and Weight Data of 4 Cities")+
  
# code to center the title which is left aligned
# by default
theme(plot.title = element_text(hjust = 0.5))

Producción:

Gráfica de burbujas categóricas usando ggplot

Método 2: Usar Plotly 

Plotly es un paquete/biblioteca de R que se utiliza para diseñar y representar gráficos interactivos. Está construido sobre la biblioteca Javascript de código abierto y se utiliza para generar gráficos y cuadros listos para su publicación. En caso de que plotly no esté incluido en su entorno R.

La sintaxis y los parámetros necesarios para representar el gráfico de burbujas categóricas mediante plotly se mencionan a continuación:

Sintaxis:

Usamos la función plot_ly() para generar gráficos usando plotly. 

Parámetro:

  • el conjunto de datos (marco de datos aquí)
  • x = ~nombre de la columna de la variable que se mostrará en el eje X
  • y = ~nombre de la columna de la variable que se mostrará en el eje Y
  • texto = ~nombre de la columna que se mostrará cuando el cursor se desplace sobre la burbuja
  • color = ~nombre de la columna en función de la cual se asigna el color (la variable categórica)
  • size = ~nombre de la columna para determinar el tamaño de la burbuja
  • tamaños = c() para especificar los rangos de los tamaños de las burbujas
  • marcador = lista() para especificar la opacidad, así como la unidad de medida como en diámetro
  • También podemos especificar el diseño que comprende el título, la estructura de la cuadrícula, etc. utilizando la función de diseño().

Acercarse

  • Crear marco de datos
  • Módulo de importación
  • Crear parcela
  • Gráfico de visualización

Programa :

R

# create data set column
height <- abs(rnorm(25, 175, 10))
  
weight <- abs(rnorm(25, 72, 10))
  
population <- floor(abs(rnorm(25, 1500, 500)))
  
cities <- c(rep("Delhi", 7), rep("Mumbai", 6),
            rep("Chennai", 6), rep("Bengaluru", 6))
  
# creating the dataframe 
dataframe <- data.frame(height, weight,
                        population, cities)
  
# calling the plotly library
library(plotly)
  
# declaring the bubbleplot variable
# to render the plot
# the first parameter is the dataframe
# x and y have the column name values of the 
# corresponding variables to plotted on the axes
# size holds the column name value to determine the 
# size of the bubbles
# color holds the value of the categorical cities
# variable
# sizes specify the range of sizes from 10 to 50
# marker parameter specifies the opacity and the 
# sizemode
bubbleplot <- plot_ly(dataframe, x = ~weight, y = ~height,
                      text = ~cities, size = ~population,
                      color = ~cities, sizes = c(10, 50),
                      marker =
                      list(opacity = 0.7,
                           sizemode = "diameter"))
  
# code to generate the layout
# specifying the title
# the grids are displayed
bubbleplot <- bubbleplot%>%layout
(title = "Height and Weight Data of 4 Cities",
 xaxis = list(showgrid = TRUE),
 yaxis = list(showgrid = TRUE))
  
# calling the bubbleplot variable to render
# the plot
bubbleplot

Producción :

Gráfica de burbuja categórica generada usando Plotly

Publicación traducida automáticamente

Artículo escrito por ag01harshit y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *