En este artículo, veremos el enfoque para combinar varios archivos CSV en el lenguaje de programación R.
Módulos utilizados
- dplyr: esta es una estructura de manipulación de datos que proporciona un conjunto uniforme de verbos, lo que ayuda a resolver los obstáculos de manipulación de datos más frecuentes.
- plyr: plyr es un paquete de R que simplifica la división de datos, hacer cosas con ellos y volver a mezclarlos.
- readr: proporciona una forma rápida y sencilla de leer datos rectangulares (como ‘csv’, ‘tsv’ y ‘fwf’).
- función list.files(): Esta función produce un vector de caracteres de los nombres de archivos o directorios en el directorio nombrado.
Sintaxis: list.files(path = “.”, pattern = NULL, all.files = FALSE,full.names = FALSE, recursive = FALSE, ignore.case = FALSE, include.dirs = FALSE, no.. = FALSE)
- Función lapply() : esta función devuelve una lista de la misma longitud que X, cada elemento de la cual es el resultado de aplicar FUN al elemento correspondiente de X.
Sintaxis: lapply(X, DIVERTIDO, …)
- Función bind_rows(): Esta función es una implementación eficiente del patrón común de do.call(rbind, dfs) o do.call(cbind, dfs) para vincular muchos marcos de datos en uno.
Sintaxis:
enlazar_filas(…, .id = NULL)
Parámetro:
…: Marcos de datos para combinar.
.id: Identificador del marco de datos.
Para combinar varios archivos CSV, el usuario debe instalar e importar paquetes dplyr, plyr y readr en la consola R para llamar a las funciones que son list.files(), lapply() y bind_rows() desde estos paquetes y pasar el parámetros requeridos para estas funciones para fusionar los múltiples archivos CSV dados en un solo marco de datos en el lenguaje de programación R.
Datos en uso:
Ejemplo:
R
library("dplyr") library("plyr") library("readr") gfg_data <- list.files(path = "C:/Users/Geetansh Sahni/Documents/R/Data", pattern = "*.csv", full.names = TRUE) %>% lapply(read_csv) %>% bind_rows gfg_data
Producción:
Publicación traducida automáticamente
Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA