¿Cómo filtrar y guardar los datos como archivos nuevos en Excel con Python Pandas?

Prerrequisitos: Python Pandas

Pandas es principalmente popular para importar y analizar datos mucho más fácilmente. Pandas es rápido y tiene un alto rendimiento y productividad para los usuarios.

En este artículo, intentamos filtrar los datos de una hoja de Excel y guardar los datos filtrados como un nuevo archivo de Excel.

Nota: puede hacer clic en este nombre de archivo para descargar esta hoja datasets.xlsx

Hoja de Excel utilizada:

En esta hoja de Excel tenemos tres categorías en la columna Especies:

  1. Setosa
  2. Versicolor
  3. virginica

Ahora nuestro objetivo es filtrar estos datos por categoría de especie y guardar estos datos filtrados en diferentes hojas con nombre de archivo = especie.nombre de subcategoría, es decir, después de la ejecución del código obtendremos tres archivos con los siguientes nombres:

  1. Setosa.xlsx
  2. Versicolor.xlsx
  3. virginica.xlsx

A continuación se muestra la implementación.

# Python code to filter and save the 
# data with different file names
import pandas
  
  
data = pandas.read_excel("datasets.xlsx")
  
speciesdata = data["Species"].unique()
  
for i in speciesdata:
    a = data[data["Species"].str.contains(i)]
    a.to_excel(i+".xlsx")

Producción:

Explicación:

  • Primero, hemos importado la biblioteca Pandas.
  • Luego hemos cargado el archivo de Excel data.xlsx en el objeto de datos.
  • Para obtener los valores únicos de esa columna de especies, hemos utilizado unique()la función. Para verificar los valores únicos en la columna Species, hemos llamado a unique() en el objeto de datos de especies.
  • Luego vamos a iterar el objeto de datos de especies ya que vamos a almacenar los valores únicos de la columna Especie (es decir, Setosa, Versicolor, Virginica) uno por uno.
  • En el objeto «a» estamos filtrando los datos que coinciden con el Species.speciesdataes decir, en cada iteración el objeto a almacenará tres tipos diferentes de datos, es decir, datos de tipo Setosa, luego datos de tipo Versicolor y, por último, datos de tipo Virginica.
  • Ahora, para guardar los datos filtrados uno por uno en el archivo de Excel, hemos utilizado la función to_excel, donde el archivo se guardará con el nombre de los datos de la especie.

Publicación traducida automáticamente

Artículo escrito por amitkkumra y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *