Python | Marco de datos de pandas.corrwith()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

Pandas dataframe.corrwith()se utiliza para calcular la correlación por pares entre filas o columnas de dos objetos DataFrame. Si la forma de dos objetos de marco de datos no es la misma, el valor de correlación correspondiente será un NaNvalor.

Sintaxis: DataFrame.count(axis=0, level=Ninguno, numeric_only=False)

Parámetros:
otro: Eje del marco de datos
: 0 o ‘índice’ para calcular por columnas, 1 o ‘columnas’ para
soltar por filas: Elimina los índices faltantes del resultado, el valor predeterminado devuelve la unión de todos

Devoluciones: correls : Serie

Nota: La correlación de una variable consigo misma es 1.

Ejemplo n.º 1: use corrwith()la función para encontrar la correlación entre dos objetos de marco de datos a lo largo del eje de la columna

# importing pandas as pd
import pandas as pd
  
# Creating the first dataframe
df1 = pd.DataFrame({"A":[1, 5, 7, 8], 
                    "B":[5, 8, 4, 3],
                    "C":[10, 4, 9, 3]})
  
# Creating the second dataframe 
df2 = pd.DataFrame({"A":[5, 3, 6, 4],
                    "B":[11, 2, 4, 3],
                    "C":[4, 3, 8, 5]})
  
# Print the first dataframe
print(df1, "\n")
  
# Print the second dataframe
print(df2)


Ahora encuentre la correlación entre las columnas de los dos marcos de datos a lo largo del eje de la fila.

# To find the correlation among the
# columns of df1 and df2 along the column axis
df1.corrwith(df2, axis = 0)

Salida:

la serie de salida contiene la correlación entre las tres columnas de dos objetos de marco de datos respectivamente.
 
Ejemplo n.º 2: use corrwith()la función para encontrar la correlación entre dos objetos de marco de datos a lo largo del eje de la fila

# importing pandas as pd
import pandas as pd
  
# Creating the first dataframe
df1 = pd.DataFrame({"A":[1, 5, 7, 8],
                    "B":[5, 8, 4, 3],
                    "C":[10, 4, 9, 3]})
  
# Creating the second dataframe 
df2 = pd.DataFrame({"A":[5, 3, 6, 4],
                    "B":[11, 2, 4, 3], 
                    "C":[4, 3, 8, 5]})
  
# To find the correlation among the
# columns of df1 and df2 along the row axis
df1.corrwith(df2, axis = 1)

Producción :

La serie de salida contiene la correlación entre las cuatro filas de dos objetos de marco de datos, respectivamente.

Publicación traducida automáticamente

Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *