¿Cómo guardar el marco de datos de Pandas como archivo gzip/zip?

Pandas es una biblioteca de código abierto que se basa en la biblioteca NumPy . Es un paquete de Python que ofrece varias estructuras de datos y operaciones para manipular datos numéricos y series de tiempo. Es principalmente popular para importar y analizar datos mucho más fácilmente. Pandas es rápido y tiene un alto rendimiento y productividad para los usuarios. 

Conversión a archivo zip/gzip

El método to_pickle() en Pandas se usa para encurtir (serializar) el objeto dado en el archivo. Este método utiliza la sintaxis que se indica a continuación:

Sintaxis:

DataFrame.to_pickle(self, path,
                   compression='infer',
                   protocol=4)

Este método admite compresiones como zip, gzip, bz2 y xz. En los ejemplos dados, verá cómo convertir un DataFrame en zip y gzip.

Ejemplo 1: guardar el marco de datos de Pandas como archivo zip

Python3

# importing packages
import pandas as pd
  
# dictionary of data
dct = {'ID': {0: 23, 1: 43, 2: 12,
  
              3: 13, 4: 67},
  
       'Name': {0: 'Ajay', 1: 'Deep',
  
                2: 'Deepanshi', 3: 'Mira',
  
                4: 'Yash'},
  
       'Marks': {0: 89, 1: 97, 2: 45, 3: 78,
  
                 4: 56},
  
       'Grade': {0: 'B', 1: 'A', 2: 'F', 3: 'C',
  
                 4: 'E'}
       }
  
# forming dataframe and printing
data = pd.DataFrame(dct)
print(data)
  
# using to_pickle function to form file
# by default, compression type infers from the file extension in specified path.
# file will be created in the given path
data.to_pickle('file.zip')

Producción:

 

Ejemplo 2: Guarde el marco de datos de Pandas como archivo gzip.

Python3

# importing packages
import pandas as pd
  
# dictionary of data
dct = {"C1": range(5), "C2": range(5, 10)}
  
# forming dataframe and printing
data = pd.DataFrame(dct)
print(data)
  
# using to_pickle function to form file
# we can also select compression type
# file will be created in the given path
data.to_pickle('file.gzip')

Producción:

Lectura de archivos zip/gzip

Para leer los archivos creados, deberá usar el método read_pickle() . Este método utiliza la sintaxis que se indica a continuación:

pandas.read_pickle(filepath_or_buffer,  
               compression='infer')

Ejemplo 1: Leer archivo zip

Python3

# reading from the zip file
pd.read_pickle('file.zip')

Producción:

 

Ejemplo 2: lectura del archivo gzip.

Python3

# reading from gzip file
pd.read_pickle('file.gzip')

Producción:

De los dos ejemplos anteriores, podemos ver que ambos archivos comprimidos se pueden leer con el método read_pickle() sin ningún cambio, excepto la extensión del archivo.

Publicación traducida automáticamente

Artículo escrito por vivekpy y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *