Lectura de archivos en R Programación

Hasta ahora, las operaciones que utilizan el programa R se realizan en un indicador/terminal que no está almacenado en ninguna parte. Pero en la industria del software, la mayoría de los programas están escritos para almacenar la información obtenida del programa. Una de esas formas es almacenar la información obtenida en un archivo. Entonces, las dos operaciones más comunes que se pueden realizar en un archivo son:

  • Importación/lectura de archivos en R
  • Exportar/Escribir archivos en R

Lectura de archivos en lenguaje de programación R

Cuando se termina un programa, se pierden todos los datos. El almacenamiento en un archivo conservará nuestros datos incluso si el programa finaliza. Si tenemos que introducir una gran cantidad de datos, tardaremos mucho en introducirlos todos. Sin embargo, si tenemos un archivo que contiene todos los datos, podemos acceder fácilmente al contenido del archivo usando algunos comandos en R. Puede mover fácilmente sus datos de una computadora a otra sin ningún cambio. Entonces esos archivos se pueden almacenar en varios formatos. Puede almacenarse en un archivo .txt (valores separados por tabuladores), o en un formato tabular, es decir, un archivo .csv (valores separados por comas), o puede estar en Internet o en la nube. R proporciona métodos mucho más fáciles para leer esos archivos.

Lectura de archivos en R

Uno de los formatos importantes para almacenar un archivo es un archivo de texto. R proporciona varios métodos para leer datos de un archivo de texto.

  • read.delim() : Este método se utiliza para leer archivos de «valores separados por tabuladores» («.txt»). De forma predeterminada, el punto («.») se utiliza como puntos decimales.

Sintaxis: read.delim(archivo, encabezado = VERDADERO, sep = “\t”, dec = “.”, …)

Parámetros:

  • archivo: la ruta al archivo que contiene los datos que se leerán en R.
  • encabezado: un valor lógico. Si es VERDADERO, read.delim() asume que su archivo tiene una fila de encabezado, por lo que la fila 1 es el nombre de cada columna. Si ese no es el caso, puede agregar el encabezado del argumento = FALSO.
  • sep: el carácter separador de campo. “\t” se utiliza para un archivo delimitado por tabulaciones.
  • dec: el carácter utilizado en el archivo para los puntos decimales.

Ejemplo: 

R

# R program reading a text file
 
# Read a text file using read.delim()
myData = read.delim("geeksforgeeks.txt", header = FALSE)
print(myData)

Producción: 

1 A computer science portal for geeks.

Nota: El código R anterior asume que el archivo «geeksforgeeks.txt» está en su directorio de trabajo actual. Para conocer su directorio de trabajo actual, escriba la función getwd() en la consola R.

  • read.delim2() : Este método se utiliza para leer archivos de «valores separados por tabuladores» («.txt»). De forma predeterminada, el punto («,») se utiliza como puntos decimales.

Sintaxis: read.delim2(archivo, encabezado = VERDADERO, sep = “\t”, dec = “,”, …)

Parámetros:

  • archivo: la ruta al archivo que contiene los datos que se leerán en R.
  • encabezado: un valor lógico. Si es VERDADERO, read.delim2() asume que su archivo tiene una fila de encabezado, por lo que la fila 1 es el nombre de cada columna. Si ese no es el caso, puede agregar el encabezado del argumento = FALSO.
  • sep: el carácter separador de campo. “\t” se utiliza para un archivo delimitado por tabulaciones.
  • dec: el carácter utilizado en el archivo para los puntos decimales.

Ejemplo: 

R

# R program reading a text file
 
# Read a text file using read.delim2
myData = read.delim2("geeksforgeeks.txt", header = FALSE)
print(myData)

Producción: 

1 A computer science portal for geeks.
  • file.choose() : En R también es posible elegir un archivo de forma interactiva usando la función file.choose() , y si eres un principiante en la programación de R, este método te resultará muy útil.

Ejemplo: 
 

R

# R program reading a text file using file.choose()
 
myFile = read.delim(file.choose(), header = FALSE)
# If you use the code above in RStudio
# you will be asked to choose a file
print(myFile)

Producción: 

1 A computer science portal for geeks.
  • read_tsv() : este método también se usa para leer valores separados por tabulaciones («\t») usando la ayuda del paquete readr .

Sintaxis: read_tsv(file, col_names = TRUE)

Parámetros:

  • archivo: la ruta al archivo que contiene los datos que se leerán en R.
  • col_names: VERDADERO, FALSO o un vector de caracteres que especifica los nombres de las columnas. Si es VERDADERO, la primera fila de la entrada se usará como los nombres de las columnas.

Ejemplo: 

R

# R program to read text file
# using readr package
 
# Import the readr library
library(readr)
 
# Use read_tsv() to read text file
myData = read_tsv("geeksforgeeks.txt", col_names = FALSE)
print(myData)

Producción: 

# A tibble: 1 x 1
  X1                                  
                                 
1 A computer science portal for geeks.

Nota: También puede usar file.choose() con read_tsv() como antes. 

# Read a txt file
myData <- read_tsv(file.choose())

Leer una línea a la vez

read_lines() : este método se usa para la línea de lectura de su propia elección, ya sea una, dos o diez líneas a la vez. Para usar este método, debemos importar el paquete del lector .

Sintaxis: read_lines(file, skip = 0, n_max = -1L)

Parámetros:

  • archivo: ruta del archivo
  • skip: Número de líneas a saltar antes de leer los datos
  • n_max: Número de líneas a leer. Si n es -1, se leerán todas las líneas del archivo.

Ejemplo: 

R

# R program to read one line at a time
 
# Import the readr library
library(readr)
 
# read_lines() to read one line at a time
myData = read_lines("geeksforgeeks.txt", n_max = 1)
print(myData)
 
# read_lines() to read two line at a time
myData = read_lines("geeksforgeeks.txt", n_max = 2)
print(myData)

Producción: 

[1] "A computer science portal for geeks."

[1] "A computer science portal for geeks."         
[2] "Geeksforgeeks is founded by Sandeep Jain Sir."

Leyendo todo el archivo

read_file() : Este método se utiliza para leer todo el archivo. Para usar este método, debemos importar el paquete del lector.

Syntax: read_lines(file)

file: the file path

Ejemplo: 

R

# R program to read the whole file
 
# Import the readr library
library(readr)
 
# read_file() to read the whole file
myData = read_file("geeksforgeeks.txt")
print(myData)

Producción:

[1] «Un portal de informática para geeks.\r\nGeeksforgeeks fue fundado por Sandeep Jain Sir.\r\nSoy pasante en esta increíble plataforma».

Lectura de un archivo en formato de tabla

Otro formato popular para almacenar un archivo es el formato tabular. R proporciona varios métodos para leer datos de un archivo de datos con formato tabular.

read.table() : read.table() es una función general que se puede usar para leer un archivo en formato de tabla. Los datos se importarán como un marco de datos.

Sintaxis: read.table(file, header = FALSE, sep = “”, dec = “.”)

Parámetros:

  • archivo: la ruta al archivo que contiene los datos que se van a importar a R.
  • encabezado: valor lógico. Si es VERDADERO, read.table() asume que su archivo tiene una fila de encabezado, por lo que la fila 1 es el nombre de cada columna. Si ese no es el caso, puede agregar el encabezado del argumento = FALSO.
  • sep: el carácter separador de campo
  • dec: el carácter utilizado en el archivo para los puntos decimales.

Ejemplo: 

R

# R program to read a file in table format
 
# Using read.table()
myData = read.table("basic.csv")
print(myData)

Producción:

1 Name,Age,Qualification,Address
2 Amiya,18,MCA,BBS
3 Niru,23,Msc,BLS
4 Debi,23,BCA,SBP
5 Biku,56,ISC,JJP

read.csv() : read.csv() se utiliza para leer archivos de «valores separados por comas» («.csv»). En esto también los datos se importarán como un marco de datos.

Sintaxis: read.csv(archivo, encabezado = VERDADERO, sep = “,”, dec = “.”, …)

Parámetros:

  • archivo: la ruta al archivo que contiene los datos que se van a importar a R.
  • encabezado: valor lógico. Si es VERDADERO, read.csv() asume que su archivo tiene una fila de encabezado, por lo que la fila 1 es el nombre de cada columna. Si ese no es el caso, puede agregar el encabezado del argumento = FALSO.
  • sep: el carácter separador de campo
  • dec: el carácter utilizado en el archivo para los puntos decimales. 
     

Ejemplo: 

R

# R program to read a file in table format
 
# Using read.csv()
myData = read.csv("basic.csv")
print(myData)

Producción: 

Name Age Qualification Address
1 Amiya  18           MCA     BBS
2  Niru  23           Msc     BLS
3  Debi  23           BCA     SBP
4  Biku  56           ISC     JJP

read.csv2() : read.csv() se usa para la variante que se usa en países que usan una coma «,» como punto decimal y un punto y coma «;» como separadores de campo.

Sintaxis: read.csv2(archivo, encabezado = VERDADERO, sep = “;”, dec = “,”, …)

Parámetros:

  • archivo: la ruta al archivo que contiene los datos que se van a importar a R.
  • encabezado: valor lógico. Si es VERDADERO, read.csv2() asume que su archivo tiene una fila de encabezado, por lo que la fila 1 es el nombre de cada columna. Si ese no es el caso, puede agregar el encabezado del argumento = FALSO.
  • sep: el carácter separador de campo
  • dec: el carácter utilizado en el archivo para los puntos decimales. 
     

Ejemplo: 

R

# R program to read a file in table format
 
# Using read.csv2()
myData = read.csv2("basic.csv")
print(myData)

Producción: 

Name.Age.Qualification.Address
1               Amiya,18,MCA,BBS
2                Niru,23,Msc,BLS
3                Debi,23,BCA,SBP
4                Biku,56,ISC,JJP

file.choose() : También puede usar file.choose() con read.csv() como antes.

Ejemplo: 

R

# R program to read a file in table format
 
# Using file.choose() inside read.csv()
myData = read.csv(file.choose())
# If you use the code above in RStudio
# you will be asked to choose a file
print(myData)

Producción: 

Name Age Qualification Address
1 Amiya  18           MCA     BBS
2  Niru  23           Msc     BLS
3  Debi  23           BCA     SBP
4  Biku  56           ISC     JJP

read_csv() : este método también se usa para leer valores separados por comas («,») usando la ayuda del paquete readr.

Sintaxis: read_csv(file, col_names = TRUE)

Parámetros:

  • archivo: la ruta al archivo que contiene los datos que se leerán en R.
  • col_names: VERDADERO, FALSO o un vector de caracteres que especifica los nombres de las columnas. Si es VERDADERO, la primera fila de la entrada se usará como los nombres de las columnas.

Ejemplo: 

R

# R program to read a file in table format
# using readr package
 
# Import the readr library
library(readr)
 
# Using read_csv() method
myData = read_csv("basic.csv", col_names = TRUE)
print(myData)

Producción: 

Parsed with column specification:
cols(
  Name = col_character(),
  Age = col_double(),
  Qualification = col_character(),
  Address = col_character()
)
# A tibble: 4 x 4
  Name    Age Qualification Address
               
1 Amiya    18 MCA           BBS    
2 Niru     23 Msc           BLS    
3 Debi     23 BCA           SBP    
4 Biku     56 ISC           JJP   

Leer un archivo de internet

Es posible utilizar las funciones read.delim() , read.csv() y read.table() para importar archivos desde la web.

Ejemplo: 

R

# R program to read a file from the internet
 
# Using read.delim()
myData = read.delim("http://www.sthda.com/upload/boxplot_format.txt")
print(head(myData))

Producción: 

Nom variable Group
1 IND1       10     A
2 IND2        7     A
3 IND3       20     A
4 IND4       14     A
5 IND5       14     A
6 IND6       12     A

Publicación traducida automáticamente

Artículo escrito por AmiyaRanjanRout y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *