El lenguaje de programación R nos permite leer y escribir datos en varios archivos como CSV, Excel, XML, etc. En este artículo, discutiremos cómo convertir contenido de Excel en DataFrame en la programación R. Para leer un archivo de Excel en sí mismo, se usa la función read.xlsx() de xlsx.
Instalación
Este módulo no está integrado en R, pero se puede instalar e importar de forma explícita. Abra la consola R y escriba el comando que se indica a continuación para instalar el paquete xlsx.
instalar.paquetes («xlsx»)
read_xlsx() se puede usar de la siguiente manera:
Sintaxis: read.xlsx («Ruta del archivo de Excel», nombre de la hoja = «nombre de la hoja», …)
Parámetros: es necesario proporcionar la ruta del archivo de Excel y el nombre de la hoja como argumento en la función read.xlsx(), pero esta función puede usar muchos otros parámetros, como colNames , rowNames , skipEmptyRows , skipEmptyCols , rows , cols , etc. para hacer algunas modificaciones extra. Aquí usamos colIndex como parámetro para obtener solo la columna que queremos. aquí damos 1 como valor del parámetro colIndex para obtener la primera columna del archivo de Excel.
Archivo en uso:
IDENTIFICACIÓN | Nombre | Años |
---|---|---|
1225 | John | 19 |
1226 | jane | 19 |
1227 | Factura | sesenta y cinco |
1228 | Elón | 49 |
Primero, importamos el paquete xlsx usando la función library() y luego proporcionamos la ruta completa del archivo de Excel a la variable llamada excel_path . Para crear un marco de datos, siga extrayendo columnas del archivo y combínelas en un marco de datos una vez hecho.
Programa:
R
library(xlsx) excel_path <- "excelContent.xlsx" id <- read.xlsx(excel_path, sheetName = "ageData", colIndex = 1) Name <- read.xlsx(excel_path, sheetName = "ageData", colIndex = 2) Age <- read.xlsx(excel_path, sheetName = "ageData", colIndex = 3) DataFrame <- data.frame(id, Name, Age)
Producción:
Publicación traducida automáticamente
Artículo escrito por erkrutikpatel y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA