Prerrequisitos: Python Pandas
Pandas es principalmente popular para importar y analizar datos mucho más fácilmente. Pandas es rápido y tiene un alto rendimiento y productividad para los usuarios.
En este artículo, intentamos filtrar los datos de una hoja de Excel y guardar los datos filtrados como un nuevo archivo de Excel.
Nota: puede hacer clic en este nombre de archivo para descargar esta hoja datasets.xlsx
Hoja de Excel utilizada:
En esta hoja de Excel tenemos tres categorías en la columna Especies:
- Setosa
- Versicolor
- virginica
Ahora nuestro objetivo es filtrar estos datos por categoría de especie y guardar estos datos filtrados en diferentes hojas con nombre de archivo = especie.nombre de subcategoría, es decir, después de la ejecución del código obtendremos tres archivos con los siguientes nombres:
- Setosa.xlsx
- Versicolor.xlsx
- virginica.xlsx
A continuación se muestra la implementación.
# Python code to filter and save the # data with different file names import pandas data = pandas.read_excel("datasets.xlsx") speciesdata = data["Species"].unique() for i in speciesdata: a = data[data["Species"].str.contains(i)] a.to_excel(i+".xlsx")
Producción:
Explicación:
- Primero, hemos importado la biblioteca Pandas.
- Luego hemos cargado el archivo de Excel data.xlsx en el objeto de datos.
- Para obtener los valores únicos de esa columna de especies, hemos utilizado
unique()
la función. Para verificar los valores únicos en la columna Species, hemos llamado a unique() en el objeto de datos de especies. - Luego vamos a iterar el objeto de datos de especies ya que vamos a almacenar los valores únicos de la columna Especie (es decir, Setosa, Versicolor, Virginica) uno por uno.
- En el objeto «a» estamos filtrando los datos que coinciden con el
Species.speciesdata
es decir, en cada iteración el objeto a almacenará tres tipos diferentes de datos, es decir, datos de tipo Setosa, luego datos de tipo Versicolor y, por último, datos de tipo Virginica. - Ahora, para guardar los datos filtrados uno por uno en el archivo de Excel, hemos utilizado la función to_excel, donde el archivo se guardará con el nombre de los datos de la especie.
Publicación traducida automáticamente
Artículo escrito por amitkkumra y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA