Cómo establecer nombres de columna dentro de la función agregada en R

En este artículo, discutiremos cómo establecer nombres de columna con la función de agregado en el lenguaje de programación R.

El método agregado en base R se usa para dividir el marco de datos en subconjuntos más pequeños y calcular estadísticas de resumen para cada uno de los grupos formados. La función a aplicar puede ser suma, media, moda o cualquiera de los métodos agregados predefinidos disponibles. Este método da una mayor claridad sobre los datos. 

Sintaxis: agregado (fórmula, datos, función)

Parámetros:

  • fórmula: la(s) variable(s) del marco de datos de entrada en el que queremos aplicar funciones. 
  • datos: los datos que queremos usar para agrupar por operación.
  • función: la función o cálculo a aplicar. 

Método 1: Usar el método setNames()

El método setNames() se usa para especificar el nombre de un objeto y luego devolver el objeto. En el caso de marco de datos, las columnas se pueden renombrar con nuevos nombres, usando el método c(). 

Sintaxis: setNames(data, col-name-vec)

Parámetro: 

datos: el marco de datos al que se aplicará la función

col-name-vec: el vector de nombre de columna que contiene los nombres de las columnas. 

Ejemplo: Establecer nombres de columna con función de agregado

R

# creating a data frame 
data_frame <- data.frame(col1 = c(1:9),
                         col2 = LETTERS[1:3])
  
print("Original DataFrame")
print(data_frame)
  
# using aggregate method
data_agg <- aggregate(col1 ~ col2, data_frame, sum)
  
# using setnames method
data_mod <- setNames(data_agg,  
                       c("C1", "C2"))
  
print("Modified DataFrame")
print(data_mod)

Producción

[1] "Original DataFrame" 
  col1 col2 
1    1    A 
2    2    B 
3    3    C 
4    4    A 
5    5    B 
6    6    C 
7    7    A 
8    8    B 
9    9    C >
[1] "Modified DataFrame" 
  C1 C2 
1  A 12 
2  B 15 
3  C 18

Método 2: Usar el método list()

Las columnas del marco de datos se pueden asignar explícitamente a listas usando el método list() en R. Como resultado de esto, se puede especificar un objeto de lista genérico con un nombre personalizado dentro del uso de la función agregada. 

Sintaxis:

list(new-col-name = df$old-col-name)

Ejemplo: Establecer nombres de columna con función de agregado

R

# creating a data frame 
data_frame <- data.frame(col1 = c(1:9),
                         col2 = LETTERS[1:3])
  
print("Original DataFrame")
print(data_frame)
  
# using aggregate method
data_mod <- aggregate(  list(mean = data_frame$col1),               
                        list(letter = data_frame$col2),
                        mean)
  
# printing the modified dataframe                                                  
print("Modified DataFrame")
print(data_mod)

Producción

[1] "Original DataFrame" 
  col1 col2 
1    1    A 
2    2    B 
3    3    C 
4    4    A 
5    5    B 
6    6    C 
7    7    A 
8    8    B 
9    9    C 
[1] "Modified DataFrame" 
  letter mean 
1      A    4 
2      B    5 
3      C    6

Publicación traducida automáticamente

Artículo escrito por yashchuahan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *