Pandas es una biblioteca de código abierto que se basa en la biblioteca NumPy . Es un paquete de Python que ofrece varias estructuras de datos y operaciones para manipular datos numéricos y series de tiempo. Es principalmente popular para importar y analizar datos mucho más fácilmente. Pandas es rápido y tiene un alto rendimiento y productividad para los usuarios.
Conversión a archivo zip/gzip
El método to_pickle() en Pandas se usa para encurtir (serializar) el objeto dado en el archivo. Este método utiliza la sintaxis que se indica a continuación:
Sintaxis:
DataFrame.to_pickle(self, path, compression='infer', protocol=4)
Este método admite compresiones como zip, gzip, bz2 y xz. En los ejemplos dados, verá cómo convertir un DataFrame en zip y gzip.
Ejemplo 1: guardar el marco de datos de Pandas como archivo zip
Python3
# importing packages import pandas as pd # dictionary of data dct = {'ID': {0: 23, 1: 43, 2: 12, 3: 13, 4: 67}, 'Name': {0: 'Ajay', 1: 'Deep', 2: 'Deepanshi', 3: 'Mira', 4: 'Yash'}, 'Marks': {0: 89, 1: 97, 2: 45, 3: 78, 4: 56}, 'Grade': {0: 'B', 1: 'A', 2: 'F', 3: 'C', 4: 'E'} } # forming dataframe and printing data = pd.DataFrame(dct) print(data) # using to_pickle function to form file # by default, compression type infers from the file extension in specified path. # file will be created in the given path data.to_pickle('file.zip')
Producción:
Ejemplo 2: Guarde el marco de datos de Pandas como archivo gzip.
Python3
# importing packages import pandas as pd # dictionary of data dct = {"C1": range(5), "C2": range(5, 10)} # forming dataframe and printing data = pd.DataFrame(dct) print(data) # using to_pickle function to form file # we can also select compression type # file will be created in the given path data.to_pickle('file.gzip')
Producción:
Lectura de archivos zip/gzip
Para leer los archivos creados, deberá usar el método read_pickle() . Este método utiliza la sintaxis que se indica a continuación:
pandas.read_pickle(filepath_or_buffer, compression='infer')
Ejemplo 1: Leer archivo zip
Python3
# reading from the zip file pd.read_pickle('file.zip')
Producción:
Ejemplo 2: lectura del archivo gzip.
Python3
# reading from gzip file pd.read_pickle('file.gzip')
Producción:
De los dos ejemplos anteriores, podemos ver que ambos archivos comprimidos se pueden leer con el método read_pickle() sin ningún cambio, excepto la extensión del archivo.