¿Cómo ordenar cajas en boxplot con fct_reorder en R?

En este artículo, discutiremos cómo reordenar cajas en boxplot con la función fct_reorder() en el lenguaje de programación R.

De forma predeterminada, el diagrama de caja ggplot2 ordena las cajas en orden alfabético de variable categórica. Pero para una mejor visualización de los datos, a veces necesitamos reordenarlos en orden. Para ordenar los datos en orden ascendente o descendente, usamos la función fct_reorder() del paquete forcats. El paquete forcats del lenguaje R contiene asistentes para reordenar y modificar los niveles de los factores. La función fct_reorder() nos ayuda a reordenar los niveles de los factores ordenándolos junto con otra variable.

Método 1: reordenar el diagrama de caja en orden ascendente

La función fct_reorder() por defecto ordena los datos en orden ascendente de value_variable. Entonces, usamos la función fact_reorder() para ordenar los datos primero en orden ascendente. Luego usamos la función geom_boxplot() del paquete ggplot2 para trazar el diagrama de caja.

Sintaxis: df %>% mutate(variable_categórica=fct_reorder(variable_categórica, variable_valor))

Parámetros:

  • df: determina el marco de datos que se utilizará para reordenar los datos.
  • categorical_variable: determina la variable que se va a reordenar.
  • value_variable: determina la variable según la cual se van a reordenar los datos.

Sintaxis para instalar e importar el paquete tidyverse:

install.package('tidyverse')    # To install
library(tidyverse)              # To import  

Ejemplo:

Aquí hay un diagrama de caja básico con cajas ordenadas en orden ascendente. El CSV utilizado en el ejemplo se puede descargar aquí .

R

# load library tidyverse
library(tidyverse)
  
# load sample data
sample_data <- read.csv("sample_box.CSV")
  
# Reorder data with fct_reorder function 
# and plot boxplot
sample_data <- sample_data%>%mutate(Brand=fct_reorder(Brand, Result))
  
# plot boxplot
ggplot(sample_data, aes(x=Result, y=Brand))+
          geom_boxplot()

Producción:

Método 2: reordenar el diagrama de caja en orden descendente

Para reordenar los datos en orden descendente, usamos el argumento .desc de la función fct_reorder(). El argumento .desc cuando es verdadero, ordena los datos en orden descendente; de ​​forma predeterminada, es falso, por lo que proporciona datos en orden ascendente.

Sintaxis: df %>% mutate(variable_categórica=fct_reorder(variable_categórica, variable_valor, .desc))

Parámetros:

  • .desc: determina un valor booleano, que si es verdadero ordena los datos en orden descendente. Por defecto, es falso.

Ejemplo:

Aquí hay un diagrama de caja básico con cajas ordenadas en orden descendente.

R

# load library tidyverse
library(tidyverse)
  
# load sample data
sample_data <- read.csv("sample_box.CSV")
  
# Reorder data with fct_reorder function 
# and plot boxplot
sample_data <- sample_data%>%mutate(Brand=fct_reorder(
  Brand, Result, .desc=TRUE))
  
# plot boxplot
ggplot(sample_data, aes(x=Result, y=Brand))+
          geom_boxplot()

Producción:

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *