Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Pandas dataframe.corrwith()
se utiliza para calcular la correlación por pares entre filas o columnas de dos objetos DataFrame. Si la forma de dos objetos de marco de datos no es la misma, el valor de correlación correspondiente será un NaN
valor.
Sintaxis: DataFrame.count(axis=0, level=Ninguno, numeric_only=False)
Parámetros:
otro: Eje del marco de datos
: 0 o ‘índice’ para calcular por columnas, 1 o ‘columnas’ para
soltar por filas: Elimina los índices faltantes del resultado, el valor predeterminado devuelve la unión de todosDevoluciones: correls : Serie
Nota: La correlación de una variable consigo misma es 1.
Ejemplo n.º 1: use corrwith()
la función para encontrar la correlación entre dos objetos de marco de datos a lo largo del eje de la columna
# importing pandas as pd import pandas as pd # Creating the first dataframe df1 = pd.DataFrame({"A":[1, 5, 7, 8], "B":[5, 8, 4, 3], "C":[10, 4, 9, 3]}) # Creating the second dataframe df2 = pd.DataFrame({"A":[5, 3, 6, 4], "B":[11, 2, 4, 3], "C":[4, 3, 8, 5]}) # Print the first dataframe print(df1, "\n") # Print the second dataframe print(df2)
Ahora encuentre la correlación entre las columnas de los dos marcos de datos a lo largo del eje de la fila.
# To find the correlation among the # columns of df1 and df2 along the column axis df1.corrwith(df2, axis = 0)
Salida:
la serie de salida contiene la correlación entre las tres columnas de dos objetos de marco de datos respectivamente.
Ejemplo n.º 2: use corrwith()
la función para encontrar la correlación entre dos objetos de marco de datos a lo largo del eje de la fila
# importing pandas as pd import pandas as pd # Creating the first dataframe df1 = pd.DataFrame({"A":[1, 5, 7, 8], "B":[5, 8, 4, 3], "C":[10, 4, 9, 3]}) # Creating the second dataframe df2 = pd.DataFrame({"A":[5, 3, 6, 4], "B":[11, 2, 4, 3], "C":[4, 3, 8, 5]}) # To find the correlation among the # columns of df1 and df2 along the row axis df1.corrwith(df2, axis = 1)
Producción :
La serie de salida contiene la correlación entre las cuatro filas de dos objetos de marco de datos, respectivamente.
Publicación traducida automáticamente
Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA