Manejo de datos en programación R

El lenguaje de programación R se utiliza con fines estadísticos y de análisis de datos. La importación y exportación de datos se usa a menudo en todas estas aplicaciones de programación R.
El lenguaje R tiene la capacidad de leer diferentes tipos de archivos, como archivos de valores separados por comas (CSV), archivos de texto, hojas y archivos de Excel, archivos SPSS, archivos SAS, etc.

R permite a sus usuarios trabajar sin problemas con los directorios de los sistemas con la ayuda de algunas funciones predefinidas que toman la ruta del directorio como argumento o devuelven la ruta del directorio actual en el que está trabajando el usuario. A continuación se muestran algunas funciones de directorio en R:

  • getwd():Esta función se utiliza para obtener el directorio de trabajo actual que utiliza R.
  • setwd():Esta función en R se usa para cambiar la ruta del directorio de trabajo actual y la ruta del directorio se pasa como argumento en la función.
    Ejemplo:
    setwd("C:/RExamples/")
    

    O

    setwd("C:\\RExamples\\")
    
  • list.files():Esta función enumera todos los archivos y carpetas presentes en el directorio de trabajo actual.

Importación de archivos en R

Tomemos algunos archivos básicos para importar en R para aprender el enfoque de importar archivos de datos:

Importación de archivos de texto

En lenguaje R, los archivos de texto se pueden leer usando read.table()la función.

Sintaxis:

read.table(filename, header = FALSE, sep = "")

Parámetros: el
encabezado representa si el archivo contiene una fila de encabezado o no
. sep representa el valor del delimitador utilizado en el archivo.

Para conocer todos los argumentos de read.table(), ejecute el siguiente comando en R:

help("read.table")

Ejemplo:
supongamos que un archivo está presente en el directorio de trabajo actual y, utilizando la programación R, importe los datos de ese archivo de texto en particular y el contenido del archivo de texto es el que se muestra:

100 A a
200 B b
300 C c
400 D d
500 E e
600 F f

Los valores están separados por espacios en blanco.

# Check current working directory
getwd()
  
# Get content into a data frame
data <- read.table("TextFileExample.txt", 
                    header = FALSE, sep = " ")
  
# Printing content of Text File
print(data)
  
# Print the class of data
print(class(data))

Producción:

[1] "C:/Users/xyz/Documents"
   V1 V2 V3
1 100  A  a
2 200  B  b
3 300  C  c
4 400  D  d
5 500  E  e
6 600  F  f
[1] "data.frame"

Importación de archivos CSV

Los valores separados por comas o los archivos CSV se pueden importar y leer en R usando read.csv()la función.

Sintaxis:

read.csv(filename, header = FALSE, sep = "")

Parámetros: el
encabezado representa si el archivo contiene una fila de encabezado o no
. sep representa el valor del delimitador utilizado en el archivo.

Para conocer todos los argumentos de read.csv(), ejecute el siguiente comando en R:

help("read.csv")

Ejemplo:
Suponga que un archivo csv está presente en el directorio de trabajo actual y el contenido del archivo es como se muestra:

# Check current working directory
getwd()
  
# Get content into a data frame
data <- read.csv("CSVFileExample.csv", 
                  header = FALSE,sep = "\t")
  
# Printing content of Text File
print(data)
  
# Print the class of data
print(class(data))

Producción:

[1] "C:/Users/xyz/Documents"
   V1 V2 V3
1 100 AB ab
2 200 CD cd
3 300 EF ef
4 400 GH gh
5 500 IJ ij
[1] "data.frame"

Importación de archivo de Excel

Para leer e importar los archivos de Excel, se requiere el paquete «xlsx » para usar la read.xlsx()función. Para leer archivos de Excel «.xls», se requiere el paquete » gdata » para usar read.xls()la función.

Sintaxis:

read.xlsx(filename, sheetIndex)

O

read.xlsx(filename, sheetName)

Parámetros:
sheetIndex especifica el número de hoja
sheetName especifica el nombre de la hoja

Para conocer todos los argumentos de read.xlsx(), ejecute el siguiente comando en R:

help("read.xlsx")

Ejemplo:
supongamos que hay un archivo xlsx en el directorio de trabajo actual y el contenido del archivo es el que se muestra:

# Install xlsx package
install.packages("xlsx")
  
library(xlsx)
  
# Check current working directory
getwd()
  
# Get content into a data frame
data <- read.xlsx("ExcelExample.xlsx", 
                   sheetIndex = 1, 
                   header = FALSE)
  
# Printing content of Text File
print(data)
  
# Print the class of data
print(class(data))

Producción:

[1] "C:/Users/xyz/Documents"
    X1  X2  X3
1 1000 ABC abc
2 2000 DEF def
3 3000 GHI ghi
4 4000 JKL jkl
5 5000 MNO mno
[1] "data.frame"

Exportando archivos en R

A continuación se muestran algunos métodos para exportar los datos a un archivo en R:

  • El uso de la función de consola
    cat() en R se usa para enviar el objeto a la consola. También se puede usar para redirigir la salida a un archivo en particular.

    Sintaxis:

    cat(..., file)
    

    Parámetro:
    archivo especifica el nombre de archivo al que debe redirigirse la salida

    Para conocer todos los argumentos de cat(), ejecute el siguiente comando en R:

    help("cat")

    Ejemplo:

    str = "World"
      
    # Redirect Output to file 
    cat("Hello, ", str, file = "catExample.txt")

    Salida:
    el código anterior crea un nuevo archivo y redirige la salida de cat(). El contenido del archivo se muestra a continuación después de ejecutar el código.

    Hello,  World
    
  • Usando sink()la función:
    sink() la función se usa para redirigir todas las salidas desde cat()y print()hacia el nombre de archivo dado.
    Sintaxis:
    sink(filename) # begins redirecting output to file
    .
    .
    sink()
    

    Para conocer todos los argumentos de sink(), ejecute el siguiente comando en R:

    help("sink")

    Ejemplo:

    # Begin redirecting output
    sink("SinkExample.txt")
      
    x <- c(1, 3, 4, 5, 10)
    print(mean(x))
    print(class(x))
    print(median(x))
      
    sink()

    Salida:
    el código anterior crea un nuevo archivo y redirige la salida. El contenido del archivo se muestra a continuación después de ejecutar el código.

    [1] 4.6
    [1] "numeric"
    [1] 4
    

Escribir en archivos CSV

Un objeto de marco de datos o array se puede redirigir y escribir en un archivo csv usando la write.csv()función.

Sintaxis: write.csv(x, archivo)

Parámetro:
archivo especifica el nombre de archivo utilizado para escribir

Para conocer todos los argumentos de write.csv(), ejecute el siguiente comando en R:

help("write.csv")

Ejemplo:

# Create vectors
x <- c(1, 3, 4, 5, 10)
y <- c(2, 4, 6, 8, 10)
z <- c(10, 12, 14, 16, 18)
  
# Create matrix
data <- cbind(x, y, z)
  
# Writing matrix to CSV File
write.csv(data, file = "CSVWrite.csv", row.names = FALSE)

Salida:
el código anterior crea un nuevo archivo y redirige la salida. El contenido del archivo se muestra a continuación después de ejecutar el código.

Publicación traducida automáticamente

Artículo escrito por utkarsh_kumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *