En este artículo, veremos el enfoque para combinar varios archivos CSV en el lenguaje de programación R.
En este enfoque para combinar varios archivos CSV, el usuario debe instalar e importar tres paquetes diferentes, a saber: dplyr, plyr y readr en la consola del lenguaje de programación R para llamar a las funciones que son list.files(), lapply() y bind_rows() de estos paquetes y pase los parámetros requeridos a estas funciones para fusionar los múltiples archivos CSV dados en un solo marco de datos en el lenguaje de programación R.
Función utilizada
- La función list.files() produce un vector de caracteres de los nombres de archivos o directorios en el directorio nombrado.
Sintaxis:
lista.archivos(ruta = “.”, patrón = NULL, todos.archivos = FALSO, nombres.completos = FALSO, recursivo = FALSO, ignorar.caso = FALSO, incluir.dirs = FALSO, no.. = FALSO)
- La función lapply() devuelve una lista de la misma longitud que X, cada elemento de la cual es el resultado de aplicar FUN al elemento correspondiente de X.
Sintaxis:
lapply(X, DIVERSIÓN, …)
- La función bind_rows() es una implementación eficiente del patrón común de do.call(rbind, dfs) o do.call(cbind, dfs) para vincular muchos marcos de datos en uno.
Sintaxis:
enlazar_filas(…, .id = NULL)
Carpeta en uso:
Para fusionar realmente varios archivos CSV/Excel como un marco de datos, primero se importan los paquetes necesarios y luego se lee y se une la lista de archivos.
Ejemplo:
R
library("dplyr") library("plyr") library("readr") gfg_data <- list.files(path = "C:/Users/Geetansh Sahni/Documents/R/Data", pattern = "*.csv", full.names = TRUE) %>% lapply(read_csv) %>% bind_rows gfg_data
Producción:
Publicación traducida automáticamente
Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA