¿Cómo agregar metadatos a un DataFrame o Serie con Pandas en Python?

Metadatos , también conocidos como datos sobre los datos. Los metadatos pueden brindarnos una descripción de los datos, un resumen, el almacenamiento en la memoria y el tipo de datos de esos datos en particular. Vamos a mostrar y crear metadatos.

Guión:

  • Podemos obtener metadatos simplemente usando el comando info()
  • Podemos agregar metadatos a los datos existentes y podemos ver los metadatos de los datos creados.

Pasos:

  • Crear un marco de datos
  • Ver los metadatos que ya existen
  • Cree los metadatos y visualice los metadatos.

Aquí, vamos a crear un marco de datos y podemos ver y crear metadatos en el marco de datos creado.

Ver métodos de metadatos existentes:

  • dataframe_name.info() : devolverá los valores nulos de los tipos de datos y el uso de la memoria en formato tabular
  • dataframe_name.columns() : devolverá una array que incluye todos los nombres de columna en el marco de datos
  • dataframe_name.describe() : proporcionará las estadísticas descriptivas de la columna del marco de datos numéricos dado, como la media, la mediana, la desviación estándar, etc.

Crear metadatos

Podemos crear los metadatos para el marco de datos en particular usando los métodos dataframe.scale() y dataframe.offset() . Se utilizan para representar los metadatos.

Sintaxis:

dataframe_name.escala=valor

dataframe_name.offset=valor

A continuación se muestran algunos ejemplos que muestran cómo agregar metadatos a un marco de datos o serie:

Ejemplo 1

Inicialmente cree y muestre un marco de datos.

Python3

# import required modules
import pandas as pd
 
# initialise data of lists using dictionary
data = {'Name': ['Sravan', 'Deepak', 'Radha', 'Vani'],
        'College': ['vignan', 'vignan Lara', 'vignan', 'vignan'],
        'Department': ['CSE', 'IT', 'IT', 'CSE'],
        'Profession': ['Student', 'Assistant Professor',
                       'Programmer & ass. Proff',
                       'Programmer & Scholar'],
        'Age': [22, 32, 45, 37]
        }
 
# create dataframe
df = pd.DataFrame(data)
 
# print dataframe
df

Producción:

Luego verifique los atributos y la descripción del marco de datos.

Python3

# data information
df.info()
 
# data columns description
df.columns
 
# describing columns
df.describe()

Producción:

Inicialice el desplazamiento y la escala del marco de datos.

Python3

# initializing scale and offset
# for creating meta data
df.scale = 0.1
df.offset = 15
 
# display scale and and offset
print('Scale:', df.scale)
print('Offset:', df.offset)

Producción:

Estamos almacenando datos en formato de archivo hdf5 y luego mostraremos el marco de datos junto con sus metadatos almacenados. 

Python3

# store in hdf5 file format
storedata = pd.HDFStore('college_data.hdf5')
 
# data
storedata.put('data_01', df)
 
# including metadata
metadata = {'scale': 0.1, 'offset': 15}
 
# getting attributes
storedata.get_storer('data_01').attrs.metadata = metadata
 
# closing the storedata
storedata.close()
 
# getting data
with pd.HDFStore('college_data.hdf5') as storedata:
    data = storedata['data_01']
    metadata = storedata.get_storer('data_01').attrs.metadata
 
# display data
print('\nDataframe:\n', data)
 
# display stored data
print('\nStored Data:\n', storedata)
 
# display metadata
print('\nMetadata:\n', metadata)

Producción:

Ejemplo 2

La estructura de datos de la serie en pandas no admitirá información y todos los métodos. Así que creamos metadatos y visualizamos directamente.

Python3

# import required module
import pandas as pd
 
# initialise data of lists using dictionary.
data = {'Name': ['Sravan', 'Deepak', 'Radha', 'Vani'],
        'College': ['vignan', 'vignan Lara', 'vignan', 'vignan'],
        'Department': ['CSE', 'IT', 'IT', 'CSE'],
        'Profession': ['Student', 'Assistant Professor',
                       'Programmer & ass. Proff',
                       'Programmer & Scholar'],
        'Age': [22, 32, 45, 37]
        }
 
# Create series
ser = pd.Series(data)
 
# display data
ser

Producción:

Ahora almacenaremos los metadatos y luego los mostraremos.

Python3

# storing data in hdf5 file format
storedata = pd.HDFStore('college_data.hdf5')
 
# data
storedata.put('data_01', ser)
 
# mentioning scale and offset
metadata = {'scale': 0.1, 'offset': 15}
 
storedata.get_storer('data_01').attrs.metadata = metadata
 
# storing close
storedata.close()
 
# getting attributes
with pd.HDFStore('college_data.hdf5') as storedata:
    data = storedata['data_01']
    metadata = storedata.get_storer('data_01').attrs.metadata
 
# display data
print('\nData:\n', data)
 
# display stored data
print('\nStored Data:\n', storedata)
 
# display Metadata
print('\nMetadata:\n', metadata)

Producción:

Publicación traducida automáticamente

Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *