Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
La función de Pandas dataframe.melt()
desvía un DataFrame de formato ancho a formato largo, dejando opcionalmente las variables de identificador establecidas. Esta función es útil para enviar mensajes a un DataFrame en un formato donde una o más columnas son variables de identificador (id_vars), mientras que todas las demás columnas, consideradas variables medidas (value_vars), están «sin pivotar» en el eje de fila, dejando solo dos no identificadores. columnas, ‘variable’ y ‘valor’.
Sintaxis: DataFrame.melt(id_vars=Ninguno, value_vars=Ninguno, var_name=Ninguno, value_name=’value’, col_level=Ninguno)
Parámetros:
marco: DataFrame
id_vars: Columna(s) para usar como identificador de variables
value_vars: Columna(s) des-pivotar. Si no se especifica, usa todas las columnas que no están configuradas como id_vars.
var_name : Nombre a usar para la columna ‘variable’. Si es Ninguno, usa marco.columnas.nombre o ‘variable’.
value_name: nombre que se usará para la columna ‘valor’
col_level: si las columnas son un índice múltiple, use este nivel para derretir.Devuelve: DataFrame en un formato donde una o más columnas son variables de identificación
Ejemplo #1: Utilice melt()
la función para establecer la columna «A» como variable de identificación y la columna «B» como variable de valor.
Python3
# importing pandas as pd import pandas as pd # Creating the dataframe df = pd.DataFrame({"A":[12, 4, 5, 44, 1], "B":[5, 2, 54, 3, 2], "C":[20, 16, 7, 3, 8], "D":[14, 3, 17, 2, 6]}) # Print the dataframe df
Usemos la dataframe.melt()
función para establecer la columna «A» como variable de identificación y la columna «B» como variable de valor.
Python3
# function to unpivot the dataframe df.melt(id_vars =['A'], value_vars =['B'])
Salida:
Ejemplo n.º 2: use melt()
la función para establecer la columna «A» como variable de identificación y las columnas «B» y «C» como variable de valor. También personalice los nombres de la columna de valor y variable.
Python3
# importing pandas as pd import pandas as pd # Creating the dataframe df = pd.DataFrame({"A":[12, 4, 5, 44, 1], "B":[5, 2, 54, 3, 2], "C":[20, 16, 7, 3, 8], "D":[14, 3, 17, 2, 6]}) # Print the dataframe df
Usemos la dataframe.melt()
función para establecer la columna «A» como variable de identificación y las columnas «B» y «C» como la variable de valor.
Python3
# function to unpivot the dataframe # We will also provide a customized name to the value and variable column df.melt(id_vars =['A'], value_vars =['B', 'C'], var_name ='Variable_column', value_name ='Value_column')
Producción :
Publicación traducida automáticamente
Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA