Importar solo columnas seleccionadas de datos de CSV en R

En este artículo, veremos dos enfoques diferentes para importar columnas seleccionadas de los datos de un archivo CSV en el lenguaje de programación R.

Método 1: Usar la función read.table()

En este método de importar solo las columnas seleccionadas de los datos del archivo CSV, el usuario debe llamar a la función read.table(), que es una función integrada del lenguaje de programación R, y luego pasa la columna seleccionada en sus argumentos a importar columnas particulares de los datos. Aquí, el usuario tiene que pasar el valor nulo al parámetro, para evitar importar esa columna en particular.

La función read.table() lee un archivo en formato de tabla y crea un marco de datos a partir de él, con casos correspondientes a líneas y variables a campos en el archivo.

Sintaxis:

read.table(file, header, nrows, skip, colClasses, sep)

Parámetros:

  • archivo: especifica el nombre del archivo.
  • encabezado: El encabezado es un indicador lógico que indica si la primera línea es una línea de encabezado que contiene datos o no.
  • nrows: especifica el número de filas en el conjunto de datos.
  • skip: Ayuda a saltar líneas desde el principio.
  • colClasses: Es un vector de caracteres que indica la clase de cada columna del conjunto de datos.
  • sep: Es una string que indica la forma en que se separan las columnas, es decir, por comas, espacios, dos puntos, tabulaciones, etc.

Conjunto de datos en uso:

Ejemplo:

R

gfg_data <- read.table("gfg_data.csv", header = TRUE, sep = ",",
                           colClasses = c("numeric", "NULL", "NULL",
                                          "numeric", "NULL"))
  
gfg_data

Producción:

Método 2: U sando la función fread() del paquete data.table:

En este enfoque para importar solo columnas seleccionadas al lenguaje de programación R, el usuario primero debe instalar e importar el paquete data.table en la consola R y llamar a la función read(), que es la función del paquete data.table, con la ubicación del archivo y las columnas seleccionadas que se van a importar en el argumento de selección de esta función. Además, esto conducirá a la importación de las columnas seleccionadas.  

La función fread() es rápida y más conveniente para que los controles como sep, colClasses y nrows se detecten automáticamente

Sintaxis:

fread(archivo, sep, colClasses, nrows)

Parámetro:

  • archivo: especifica el nombre del archivo.
  • colClasses: Es un vector de caracteres que indica la clase de cada columna del conjunto de datos.
  • sep: Es una string que indica la forma en que se separan las columnas, es decir, por comas, espacios, dos puntos, tabulaciones, etc.
  • nrows: especifica el número de filas en el conjunto de datos.

Ejemplo:

R

library("data.table")   
  
gfg_data <- fread("gfg_data.csv",
                  select = c("A", "C", "E"))
  
gfg_data

Producción:
 

Publicación traducida automáticamente

Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *