Metadatos , también conocidos como datos sobre los datos. Los metadatos pueden brindarnos una descripción de los datos, un resumen, el almacenamiento en la memoria y el tipo de datos de esos datos en particular. Vamos a mostrar y crear metadatos.
Guión:
- Podemos obtener metadatos simplemente usando el comando info()
- Podemos agregar metadatos a los datos existentes y podemos ver los metadatos de los datos creados.
Pasos:
- Crear un marco de datos
- Ver los metadatos que ya existen
- Cree los metadatos y visualice los metadatos.
Aquí, vamos a crear un marco de datos y podemos ver y crear metadatos en el marco de datos creado.
Ver métodos de metadatos existentes:
- dataframe_name.info() : devolverá los valores nulos de los tipos de datos y el uso de la memoria en formato tabular
- dataframe_name.columns() : devolverá una array que incluye todos los nombres de columna en el marco de datos
- dataframe_name.describe() : proporcionará las estadísticas descriptivas de la columna del marco de datos numéricos dado, como la media, la mediana, la desviación estándar, etc.
Crear metadatos
Podemos crear los metadatos para el marco de datos en particular usando los métodos dataframe.scale() y dataframe.offset() . Se utilizan para representar los metadatos.
Sintaxis:
dataframe_name.escala=valor
dataframe_name.offset=valor
A continuación se muestran algunos ejemplos que muestran cómo agregar metadatos a un marco de datos o serie:
Ejemplo 1
Inicialmente cree y muestre un marco de datos.
Python3
# import required modules import pandas as pd # initialise data of lists using dictionary data = {'Name': ['Sravan', 'Deepak', 'Radha', 'Vani'], 'College': ['vignan', 'vignan Lara', 'vignan', 'vignan'], 'Department': ['CSE', 'IT', 'IT', 'CSE'], 'Profession': ['Student', 'Assistant Professor', 'Programmer & ass. Proff', 'Programmer & Scholar'], 'Age': [22, 32, 45, 37] } # create dataframe df = pd.DataFrame(data) # print dataframe df
Producción:
Luego verifique los atributos y la descripción del marco de datos.
Python3
# data information df.info() # data columns description df.columns # describing columns df.describe()
Producción:
Inicialice el desplazamiento y la escala del marco de datos.
Python3
# initializing scale and offset # for creating meta data df.scale = 0.1 df.offset = 15 # display scale and and offset print('Scale:', df.scale) print('Offset:', df.offset)
Producción:
Estamos almacenando datos en formato de archivo hdf5 y luego mostraremos el marco de datos junto con sus metadatos almacenados.
Python3
# store in hdf5 file format storedata = pd.HDFStore('college_data.hdf5') # data storedata.put('data_01', df) # including metadata metadata = {'scale': 0.1, 'offset': 15} # getting attributes storedata.get_storer('data_01').attrs.metadata = metadata # closing the storedata storedata.close() # getting data with pd.HDFStore('college_data.hdf5') as storedata: data = storedata['data_01'] metadata = storedata.get_storer('data_01').attrs.metadata # display data print('\nDataframe:\n', data) # display stored data print('\nStored Data:\n', storedata) # display metadata print('\nMetadata:\n', metadata)
Producción:
Ejemplo 2
La estructura de datos de la serie en pandas no admitirá información y todos los métodos. Así que creamos metadatos y visualizamos directamente.
Python3
# import required module import pandas as pd # initialise data of lists using dictionary. data = {'Name': ['Sravan', 'Deepak', 'Radha', 'Vani'], 'College': ['vignan', 'vignan Lara', 'vignan', 'vignan'], 'Department': ['CSE', 'IT', 'IT', 'CSE'], 'Profession': ['Student', 'Assistant Professor', 'Programmer & ass. Proff', 'Programmer & Scholar'], 'Age': [22, 32, 45, 37] } # Create series ser = pd.Series(data) # display data ser
Producción:
Ahora almacenaremos los metadatos y luego los mostraremos.
Python3
# storing data in hdf5 file format storedata = pd.HDFStore('college_data.hdf5') # data storedata.put('data_01', ser) # mentioning scale and offset metadata = {'scale': 0.1, 'offset': 15} storedata.get_storer('data_01').attrs.metadata = metadata # storing close storedata.close() # getting attributes with pd.HDFStore('college_data.hdf5') as storedata: data = storedata['data_01'] metadata = storedata.get_storer('data_01').attrs.metadata # display data print('\nData:\n', data) # display stored data print('\nStored Data:\n', storedata) # display Metadata print('\nMetadata:\n', metadata)
Producción:
Publicación traducida automáticamente
Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA