En este artículo, discutiremos cómo calcular la correlación entre dos columnas en pandas.
La correlación se utiliza para resumir la fuerza y la dirección de la asociación lineal entre dos variables cuantitativas. Se denota por r y valores entre -1 y +1. Un valor positivo de r indica una asociación positiva y un valor negativo de r indica una asociación negativa.
Al usar la función corr() podemos obtener la correlación entre dos columnas en el marco de datos.
Sintaxis :
dataframe[‘primera_columna’].corr(dataframe[‘segunda_columna’])
dónde,
- dataframe es el dataframe de entrada
- first_column está correlacionada con second_column del marco de datos
Ejemplo 1 : programa Python para obtener la correlación entre dos columnas
Python3
# import pandas module import pandas as pd # create dataframe with 3 columns data = pd.DataFrame({ "column1": [12, 23, 45, 67], "column2": [67, 54, 32, 1], "column3": [34, 23, 56, 23] } ) # display dataframe print(data) # correlation between column 1 and column2 print(data['column1'].corr(data['column2'])) # correlation between column 2 and column3 print(data['column2'].corr(data['column3'])) # correlation between column 1 and column3 print(data['column1'].corr(data['column3']))
Producción:
column1 column2 column3 0 12 67 34 1 23 54 23 2 45 32 56 3 67 1 23 -0.9970476685163736 0.07346999975265099 0.0
También es posible obtener una correlación entre elementos para columnas con valores numéricos usando solo la función corr().
Sintaxis:
dataset.corr()
Ejemplo 2 : obtener la correlación entre elementos
Python3
# import pandas module import pandas as pd # create dataframe with 3 columns data = pd.DataFrame({ "column1": [12, 23, 45, 67], "column2": [67, 54, 32, 1], "column3": [34, 23, 56, 23] } ) # get correlation between element wise print(data.corr())
Salida :
column1 column2 column3 column1 1.000000 -0.997048 0.00000 column2 -0.997048 1.000000 0.07347 column3 0.000000 0.073470 1.00000
Publicación traducida automáticamente
Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA