En este artículo, discutiremos cómo fusionar varios archivos de Excel en el lenguaje de programación R.
Módulos utilizados:
- dplyr: el paquete dplyr en R es una estructura de manipulación de datos que proporciona un conjunto uniforme de verbos, lo que ayuda a resolver los obstáculos de manipulación de datos más frecuentes.
- plyr: el paquete «plyr» en R se usa para trabajar con datos, incluidas sus mejoras y manipulaciones.
- readxl: este paquete se utiliza para trabajar con archivos de Excel en R
- readr: este paquete se usa para leer archivos en R
Funciones utilizadas:
- La función list.files() produce un vector de caracteres de los nombres de archivos o directorios en el directorio nombrado.
Sintaxis: list.files(path = “.”, pattern = NULL, all.files = FALSE,full.names = FALSE, recursive = FALSE, ignore.case = FALSE, include.dirs = FALSE, no.. = FALSE)
- La función lapply() devuelve una lista de la misma longitud que X, cada elemento de la cual es el resultado de aplicar FUN al elemento correspondiente de X.
Sintaxis: lapply(X, DIVERTIDO, …)
- La función bind_rows() es una implementación eficiente del patrón común de do.call(rbind, dfs) o do.call(cbind, dfs) para vincular muchos marcos de datos en uno.
Sintaxis: bind_rows(…, .id = NULL)
Archivos en uso:
Ejemplo: Combinar Excel usando R
R
library("dplyr") library("plyr") library("readr") library("readxl") gfg_data <- list.files(path = "Location/to/folder", pattern = "*.xlsx", full.names = TRUE) %>% lapply(read_excel) %>% bind_rows gfg_data
Producción:
Publicación traducida automáticamente
Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA