En este artículo, discutiremos cómo crear un diagrama de caja de múltiples valores de columna usando ggplot2 en el lenguaje de programación R.
Se puede crear un marco de datos al contener valores organizados en forma de filas y columnas. Los valores pueden pertenecer a diferentes tipos de datos. El paquete reshape2 se usa para agregar datos usando las funciones melt y cast. La biblioteca se puede instalar y cargar en el espacio de trabajo usando el siguiente comando:
install.packages("reshape2")
El método de fusión en R se usa para fundir un objeto R, digamos un marco de datos en una forma adecuada para una conversión fácil.
Sintaxis :
melt(data, id.vars, measure.vars)
Parámetros:
- data – El conjunto de datos para derretir
- id.vars: variables de identificación.
- medida.vars – Variables medidas.
El método ggplot en este paquete se usa para declarar y definir un objeto ggplot. Toma como entrada un marco de datos y define un conjunto de mapeos estéticos destinados a la trama.
ggplot(data = NULL, mapping = aes())
Parámetros:
- data: el marco de datos que se usará como entrada en el método ggplot
- mapeo: lista predeterminada de mapeos estéticos para usar en la trama.
- Se pueden agregar componentes adicionales al objeto ggplot. El método geom_boxplot() se usa para dibujar un boxplot() en R.
Sintaxis :
geom_boxplot( mapping = aes(x , y , color ))
Ejemplo :
R
# importing required libraries library(reshape2) library(ggplot2) # creating a dataframe data_frame < - data.frame(col1=rep(1: 5, each=2), col2=1: 10, col3=11: 20, col4=21: 30) # creating the modified dataframe data_mod < - melt(data_frame, id.vars='col1', measure.vars=c('col2', 'col3', 'col4')) # creating a plot p < - ggplot(data_mod) + geom_boxplot(aes(x=col1, y=value, color=variable)) # printing the plot print(p)
Producción
Ejemplo 2:
El siguiente fragmento de código ilustra el trazado de los valores pertenecientes a col2 y col3 en el eje x y sus elementos de datos correspondientes en los ejes y:
R
library(reshape2) library(ggplot2) # creating a dataframe data_frame < - data.frame(col1=rep(1: 5, each=2), col2=1: 10, col3=11: 20, col4=21: 30) # creating the modified dataframe data_mod < - melt(data_frame, id.vars='col1', measure.vars=c('col2', 'col3')) # creating a plot p < - ggplot(data_mod) + geom_boxplot(aes(x=col1, y=value, color=variable)) # printing the plot print(p)
Producción:
Publicación traducida automáticamente
Artículo escrito por mallikagupta90 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA