Trabajar con archivos de Excel en la programación R

Los archivos de Excel tienen la extensión .xls, .xlsx y .csv (valores separados por comas). Para comenzar a trabajar con archivos de Excel en lenguaje de programación R , primero debemos importar archivos de Excel en RStudio o cualquier otro IDE compatible con R (entorno de desarrollo integrado).

Lectura de archivos de Excel en lenguaje de programación R

Primero, instale el paquete readxl en R para cargar archivos de Excel. Varios métodos, incluidas sus subpartes, se demuestran adicionalmente.

Muestra_datos1.xlsx:

Muestra_datos2.xlsx:

Lectura de archivos:

Los dos archivos de Excel Sample_data1.xlsx y Sample_data2.xlsx y se leen desde el directorio de trabajo.

R

# Working with Excel Files
# Installing required package
install.packages("readxl")
 
# Loading the package
library(readxl)
 
# Importing excel file
Data1 < - read_excel("Sample_data1.xlsx")
Data2 < - read_excel("Sample_data2.xlsx")
 
# Printing the data
head(Data1)
head(Data2)

Los archivos de Excel se cargan en las variables Data_1 y Data_2 como marcos de datos y luego se llama a la variable Data_1 y Data_2 que imprime el conjunto de datos.

Modificación de archivos

Se modifican el archivo Sample_data1.xlsx y Sample_file2.xlsx.

R

# Modifying the files
Data1$Pclass <- 0
 
Data2$Embarked <- "S"
 
# Printing the data
head(Data1)
head(Data2)

Se modifica a 0 el valor del atributo o variable clase P de los datos Data1. Se modifica a S el valor del atributo o variable Embarked de Data2.

Eliminación de contenido de archivos

La variable o atributo se elimina de los conjuntos de datos Data1 y Data2 que contienen los archivos Sample_data1.xlsx y Sample_data2.xlsx.

R

# Deleting from files
Data1 <- Data1[-2]
 
Data2 <- Data2[-3]
 
# Printing the data
Data1
Data2

El signo se utiliza para eliminar columnas o atributos del conjunto de datos. La columna 2 se elimina del conjunto de datos Data1 y la columna 3 se elimina del conjunto de datos Data2.

Combinar archivos

Los dos conjuntos de datos de Excel Data1 y Data2 se fusionan mediante la función merge() que se encuentra en el paquete base y viene preinstalado en R.

R

# Merging Files
Data3 <- merge(Data1, Data2, all.x = TRUE, all.y = TRUE)
 
# Displaying the data
head(Data3)

Data1 y Data2 se fusionan entre sí y el archivo resultante se almacena en la variable Data3.

Creando nuevas columnas

Se pueden crear fácilmente nuevas columnas o características en los conjuntos de datos Data1 y Data2.

R

# Creating feature in Data1 dataset
Data1$Num < - 0
 
# Creating feature in Data2 dataset
Data2$Code < - "Mission"
 
# Printing the data
head(Data1)
head(Data2)

Num es una característica nueva que se crea con un valor predeterminado de 0 en el conjunto de datos Data1. El código es una característica nueva que se crea con la misión como una string predeterminada en el conjunto de datos de Data2.

Escribir archivos

Después de realizar todas las operaciones, Data1 y Data2 se escriben en nuevos archivos usando la función write.xlsx() integrada en el paquete writexl.

R

# Installing the package
install.packages("writexl")
 
# Loading package
library(writexl)
 
# Writing Data1
write_xlsx(Data1, "New_Data1.xlsx")
 
# Writing Data2
write_xlsx(Data2, "New_Data2.xlsx")

El conjunto de datos Data1 se escribe en el archivo New_Data1.xlsx y el conjunto de datos Data2 se escribe en el archivo New_Data2.xlsx . Ambos archivos se guardan en el directorio de trabajo actual.

Publicación traducida automáticamente

Artículo escrito por dhruv5819 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *