Los archivos de Excel tienen la extensión .xls, .xlsx y .csv (valores separados por comas). Para comenzar a trabajar con archivos de Excel en lenguaje de programación R , primero debemos importar archivos de Excel en RStudio o cualquier otro IDE compatible con R (entorno de desarrollo integrado).
Lectura de archivos de Excel en lenguaje de programación R
Primero, instale el paquete readxl en R para cargar archivos de Excel. Varios métodos, incluidas sus subpartes, se demuestran adicionalmente.
Muestra_datos1.xlsx:
Muestra_datos2.xlsx:
Lectura de archivos:
Los dos archivos de Excel Sample_data1.xlsx y Sample_data2.xlsx y se leen desde el directorio de trabajo.
R
# Working with Excel Files # Installing required package install.packages("readxl") # Loading the package library(readxl) # Importing excel file Data1 < - read_excel("Sample_data1.xlsx") Data2 < - read_excel("Sample_data2.xlsx") # Printing the data head(Data1) head(Data2)
Los archivos de Excel se cargan en las variables Data_1 y Data_2 como marcos de datos y luego se llama a la variable Data_1 y Data_2 que imprime el conjunto de datos.
Modificación de archivos
Se modifican el archivo Sample_data1.xlsx y Sample_file2.xlsx.
R
# Modifying the files Data1$Pclass <- 0 Data2$Embarked <- "S" # Printing the data head(Data1) head(Data2)
Se modifica a 0 el valor del atributo o variable clase P de los datos Data1. Se modifica a S el valor del atributo o variable Embarked de Data2.
Eliminación de contenido de archivos
La variable o atributo se elimina de los conjuntos de datos Data1 y Data2 que contienen los archivos Sample_data1.xlsx y Sample_data2.xlsx.
R
# Deleting from files Data1 <- Data1[-2] Data2 <- Data2[-3] # Printing the data Data1 Data2
El signo – se utiliza para eliminar columnas o atributos del conjunto de datos. La columna 2 se elimina del conjunto de datos Data1 y la columna 3 se elimina del conjunto de datos Data2.
Combinar archivos
Los dos conjuntos de datos de Excel Data1 y Data2 se fusionan mediante la función merge() que se encuentra en el paquete base y viene preinstalado en R.
R
# Merging Files Data3 <- merge(Data1, Data2, all.x = TRUE, all.y = TRUE) # Displaying the data head(Data3)
Data1 y Data2 se fusionan entre sí y el archivo resultante se almacena en la variable Data3.
Creando nuevas columnas
Se pueden crear fácilmente nuevas columnas o características en los conjuntos de datos Data1 y Data2.
R
# Creating feature in Data1 dataset Data1$Num < - 0 # Creating feature in Data2 dataset Data2$Code < - "Mission" # Printing the data head(Data1) head(Data2)
Num es una característica nueva que se crea con un valor predeterminado de 0 en el conjunto de datos Data1. El código es una característica nueva que se crea con la misión como una string predeterminada en el conjunto de datos de Data2.
Escribir archivos
Después de realizar todas las operaciones, Data1 y Data2 se escriben en nuevos archivos usando la función write.xlsx() integrada en el paquete writexl.
R
# Installing the package install.packages("writexl") # Loading package library(writexl) # Writing Data1 write_xlsx(Data1, "New_Data1.xlsx") # Writing Data2 write_xlsx(Data2, "New_Data2.xlsx")
El conjunto de datos Data1 se escribe en el archivo New_Data1.xlsx y el conjunto de datos Data2 se escribe en el archivo New_Data2.xlsx . Ambos archivos se guardan en el directorio de trabajo actual.