¿Cómo calcular la correlación entre dos columnas en Pandas?

En este artículo, discutiremos cómo calcular la correlación entre dos columnas en pandas.

La correlación se utiliza para resumir la fuerza y ​​la dirección de la asociación lineal entre dos variables cuantitativas. Se denota por r y valores entre -1 y +1. Un valor positivo de r indica una asociación positiva y un valor negativo de r indica una asociación negativa.

Al usar la función corr() podemos obtener la correlación entre dos columnas en el marco de datos.

Sintaxis :

dataframe[‘primera_columna’].corr(dataframe[‘segunda_columna’])

dónde,

  • dataframe es el dataframe de entrada
  • first_column está correlacionada con second_column del marco de datos

Ejemplo 1 : programa Python para obtener la correlación entre dos columnas

Python3

# import pandas module
import pandas as pd
 
# create dataframe with 3 columns
data = pd.DataFrame({
    "column1": [12, 23, 45, 67],
    "column2": [67, 54, 32, 1],
    "column3": [34, 23, 56, 23]
}
)
# display dataframe
print(data)
 
# correlation between column 1 and column2
print(data['column1'].corr(data['column2']))
 
# correlation between column 2 and column3
print(data['column2'].corr(data['column3']))
 
# correlation between column 1 and column3
print(data['column1'].corr(data['column3']))

Producción:

 column1  column2  column3
0       12       67       34
1       23       54       23
2       45       32       56
3       67        1       23
-0.9970476685163736
0.07346999975265099
0.0

También es posible obtener una correlación entre elementos para columnas con valores numéricos usando solo la función corr().

Sintaxis:

dataset.corr()

Ejemplo 2 : obtener la correlación entre elementos

Python3

# import pandas module
import pandas as pd
 
# create dataframe with 3 columns
data = pd.DataFrame({
    "column1": [12, 23, 45, 67],
    "column2": [67, 54, 32, 1],
    "column3": [34, 23, 56, 23]
}
)
# get correlation between element wise
print(data.corr())

Salida :

          column1   column2  column3
column1  1.000000 -0.997048  0.00000
column2 -0.997048  1.000000  0.07347
column3  0.000000  0.073470  1.00000

Publicación traducida automáticamente

Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *