¿Cómo agregar múltiples columnas en R?

En este artículo, discutiremos cómo agregar varias columnas en el lenguaje de programación R.

Agregación significa combinar dos o más datos. Aquí vamos a utilizar la función de agregado para obtener las estadísticas de resumen de una o más variables en un marco de datos.

Sintaxis :

aggregate(sum_column ~ group_column, data, FUN)

dónde,

  • data es el marco de datos de entrada
  • sum_column es la columna que puede resumir
  • group_column es la columna que se agrupará.
  • FUN se refiere a funciones como sum, mean, min, max, etc.

Ejemplo :

Vamos a crear un marco de datos

R

# create the dataframe with 4 columns
data = data.frame(subjects=c("java", "python", "java", 
                             "java", "php", "php"),
                  id=c(1, 2, 3, 4, 5, 6),
                  names=c("manoj", "sai", "mounika",
                          "durga", "deepika", "roshan"),
                  marks=c(89, 89, 76, 89, 90, 67))
  
# display
data

Salida :

Ejemplo 1: resumir una variable y agrupar por una variable

Aquí, vamos a obtener el resumen de una variable agrupándola con una variable.

Sintaxis :

aggregate(sum_column ~ group_column, data, FUN=sum)

En este ejemplo, vamos a usar la función de suma para obtener algunas calificaciones al agrupar con materias.

R

# create the dataframe with 4 columns
data = data.frame(subjects=c("java", "python", "java",
                             "java", "php", "php"),
                  id=c(1, 2, 3, 4, 5, 6),
                  names=c("manoj", "sai", "mounika",
                          "durga", "deepika", "roshan"),
                  marks=c(89, 89, 76, 89, 90, 67))
  
# get sum of marks  by grouping with subjects
aggregate(marks~ subjects, data, FUN=sum)

Salida :

Ejemplo 2: resumir una variable y agrupar por múltiples variables

Aquí vamos a obtener el resumen de una variable agrupándola con una o más variables. Tenemos que usar el operador + para agrupar varias columnas.

Sintaxis :

agregado(suma_columna ~ grupo_columna1+grupo_columna2+……………grupo_columna, datos, DIVERSIÓN=suma)

En este ejemplo, vamos a agrupar nombres y materias para obtener la suma de las calificaciones.

R

# create the dataframe with 4 columns
data = data.frame(subjects=c("java", "python", "java",
                             "java", "php", "php"),
                  id=c(1, 2, 3, 4, 5, 6),
                  names=c("manoj", "sai", "mounika",
                          "durga", "deepika", "roshan"),
                  marks=c(89, 89, 76, 89, 90, 67))
  
# get sum of marks  by grouping with subjects and names
aggregate(marks~ subjects+names, data, FUN=sum)

Salida :

Ejemplo 3: resumir múltiples variables y agrupar por una variable

Aquí vamos a obtener el resumen de una o más variables agrupando con una variable. Usaremos la función cbind() conocida como enlace de columna para obtener un resumen de múltiples variables.

Sintaxis :

agregado(cbind(sum_column1,sum_column2,.,sum_column n) ~ group_column1+group_column2+……………group_columnn, data, FUN=sum)

En este ejemplo, vamos a obtener la suma de las calificaciones y la identificación mediante la agrupación con materias.

R

# create the dataframe with 4 columns
data = data.frame(subjects=c("java", "python", "java", 
                             "java", "php", "php"),
                  id=c(1, 2, 3, 4, 5, 6),
                  names=c("manoj", "sai", "mounika",
                          "durga", "deepika", "roshan"),
                  marks=c(89, 89, 76, 89, 90, 67))
  
# get sum of marks and id by grouping with subjects
aggregate(cbind(marks, id)~ subjects, data, FUN=sum)

Salida :

Ejemplo 4: resumir múltiples variables y agrupar por múltiples variables

Aquí, vamos a obtener el resumen de una o más variables agrupándolas con una o más variables. Podemos usar cbind() para combinar una o más variables y el operador ‘+’ para agrupar múltiples variables.

Sintaxis :

agregado(cbind(sum_column1,.,sum_column n)~ group_column1+….+group_column n, data, FUN=sum)

En este ejemplo, vamos a obtener la suma de las calificaciones y la identificación agrupándolas con materias y nombres.

R

# create the dataframe with 4 columns
data = data.frame(subjects=c("java", "python", "java",
                             "java", "php", "php"),
                  id=c(1, 2, 3, 4, 5, 6),
                  names=c("manoj", "sai", "mounika",
                          "durga", "deepika", "roshan"),
                  marks=c(89, 89, 76, 89, 90, 67))
  
# get sum of marks and id by grouping 
# with subjects and names
aggregate(cbind(marks, id)~ subjects+names, data, FUN=sum)

Salida :

Publicación traducida automáticamente

Artículo escrito por manojkumarreddymallidi y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *