Suma en varias filas y columnas usando el paquete dplyr en R

En este artículo, veremos cómo sumar varias filas y columnas usando el paquete Dplyr en el lenguaje de programación R.

El paquete dplyr se utiliza para realizar simulaciones en los datos realizando manipulaciones y transformaciones. Se puede instalar en el espacio de trabajo usando el siguiente comando: 

install.packages("dplyr")

Cálculo de sumas de filas

El método is.na() en R se usa para verificar si el valor de la variable es equivalente a NA o no. Esto es importante ya que el resultado de la mayoría de las operaciones aritméticas con valor NA es NA. El método replace() en R se puede usar para reemplazar el valor de una variable en un marco de datos. Este método se aplica a todas las celdas del marco de datos de entrada y se intercambia con un 0 dondequiera que se encuentre. 

Sintaxis: replace(data, replace-val)

Luego se aplica el método mutate() sobre el marco de datos de salida, para modificar la estructura del marco de datos modificando la estructura del marco de datos. Se pueden agregar o modificar nuevas columnas o filas en el marco de datos existente. Se puede mencionar un nuevo nombre de columna en el argumento del método y asignarlo a una función R predefinida.

Sintaxis: mutate(nuevo-col-nombre = rowSums(.))

El método rowSums() se usa para calcular la suma de cada fila y luego agregar el valor al final de cada fila bajo el nuevo nombre de columna especificado. El argumento . se utiliza para aplicar la función sobre todas las celdas del marco de datos. 

Sintaxis: sumasfilas(.)

Código:

R

library("dplyr")
  
# creating a data frame
data_frame <- data.frame(col1 = c(NA,2,3,4),
                         col2 = c(1,2,NA,0),
                         col3 = c(5,6,7,8)
                         )
print("Original DataFrame")
print(data_frame)
  
# eliminating NA values
data_without_na <- data_frame %>%                      
  replace(is.na(.), 0) 
print("Row Wise Sum")
  
data_mod <- data_without_na%>%
  mutate(sum_of_rows = rowSums(.))
print(data_mod)

Producción:

Cálculo de sumas de columnas

Los valores NA, si están presentes, se pueden eliminar del marco de datos utilizando el método replace() en R. Posteriormente, el marco de datos se somete a un método summarise_all() que se aplica a cada variable en el marco de datos. Toma como argumento la función sum para calcular la suma sobre cada columna del marco de datos. 

Sintaxis: summarise_all (suma) 

Código:

R

library("dplyr")
  
# creating a data frame
data_frame <- data.frame(col1 = c(NA,2,3,4),
                         col2 = c(1,2,NA,0),
                         col3 = c(5,6,7,8)
                         )
print("Original DataFrame")
print(data_frame)
  
# eliminating NA values
data_without_na <- data_frame %>%                      
  replace(is.na(.), 0) 
print("Column Wise Sum")
  
# computing column wise sum
data_mod <- data_without_na%>%
  summarise_all(sum)
  
# printing final output
print(data_mod)

Producción:

Publicación traducida automáticamente

Artículo escrito por yashchuahan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *