Importar y combinar varios archivos CSV en R

En este artículo, veremos el enfoque para combinar varios archivos CSV en el lenguaje de programación R.

Módulos utilizados

  • dplyr: esta es una estructura de manipulación de datos que proporciona un conjunto uniforme de verbos, lo que ayuda a resolver los obstáculos de manipulación de datos más frecuentes.
  • plyr: plyr es un paquete de R que simplifica la división de datos, hacer cosas con ellos y volver a mezclarlos.
  • readr: proporciona una forma rápida y sencilla de leer datos rectangulares (como ‘csv’, ‘tsv’ y ‘fwf’).
  • función list.files(): Esta función produce un vector de caracteres de los nombres de archivos o directorios en el directorio nombrado.

Sintaxis: list.files(path = “.”, pattern = NULL, all.files = FALSE,full.names = FALSE, recursive = FALSE, ignore.case = FALSE, include.dirs = FALSE, no.. = FALSE)

  • Función lapply() : esta función devuelve una lista de la misma longitud que X, cada elemento de la cual es el resultado de aplicar FUN al elemento correspondiente de X.

Sintaxis: lapply(X, DIVERTIDO, …)

  • Función bind_rows(): Esta función es una implementación eficiente del patrón común de do.call(rbind, dfs) ​​o do.call(cbind, dfs) ​​para vincular muchos marcos de datos en uno.

Sintaxis:

enlazar_filas(…, .id = NULL)

Parámetro:

…: Marcos de datos para combinar.

.id: Identificador del marco de datos.

Para combinar varios archivos CSV, el usuario debe instalar e importar paquetes dplyr, plyr y readr en la consola R para llamar a las funciones que son list.files(), lapply() y bind_rows() desde estos paquetes y pasar el parámetros requeridos para estas funciones para fusionar los múltiples archivos CSV dados en un solo marco de datos en el lenguaje de programación R.

Datos en uso:

Ejemplo:

R

library("dplyr")                                                
library("plyr")                                               
library("readr")  
  
gfg_data <- list.files(path = "C:/Users/Geetansh Sahni/Documents/R/Data", 
                      pattern = "*.csv", full.names = TRUE) %>%
 lapply(read_csv) %>%                                          
 bind_rows                                                      
  
gfg_data

 Producción:

Publicación traducida automáticamente

Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *