Correlación significa una asociación, es una medida de la medida en que dos variables están relacionadas.
1. Correlación positiva: cuando dos variables aumentan juntas y disminuyen juntas. Están positivamente correlacionados. ‘1’ es una correlación positiva perfecta. Por ejemplo, la demanda y el beneficio están correlacionados positivamente cuanto mayor sea la demanda del producto, mayor será el beneficio, por lo tanto, la correlación positiva.
2. Correlación Negativa: Cuando una variable aumenta y la otra variable disminuye juntas y viceversa. Están negativamente correlacionados. Por ejemplo, si la distancia entre los imanes aumenta, su atracción disminuye y viceversa. Por lo tanto, una correlación negativa. ‘-1’ no hay correlación
3. Correlación cero (sin correlación): cuando dos variables no parecen estar vinculadas en absoluto. ‘0’ es una correlación negativa perfecta. Por ejemplo, la cantidad de té que toma y el nivel de inteligencia.
Trazado de la array de correlación usando Python
Paso 1: Importación de las bibliotecas.
Python3
import sklearn import numpy as np import matplotlib.pyplot as plt import pandas as pd
Paso 2: encontrar la correlación entre dos variables.
Python3
y = pd.Series([1, 2, 3, 4, 3, 5, 4]) x = pd.Series([1, 2, 3, 4, 5, 6, 7]) correlation = y.corr(x) correlation
Producción:
Paso 3: Trazar el gráfico. Aquí estamos usando diagramas de dispersión. Un diagrama de dispersión es un diagrama donde cada valor en el conjunto de datos está representado por un punto. Además, muestra una relación entre dos variables.
Python3
# plotting the data plt.scatter(x, y) # This will fit the best line into the graph plt.plot(np.unique(x), np.poly1d(np.polyfit(x, y, 1)) (np.unique(x)), color='red')
Producción:
Recuerde los puntos que se explicaron anteriormente. Observe ambas imágenes, encontrará similitudes. Además, observe que el valor de la correlación es cercano a 1, por lo tanto, se refleja la correlación positiva.
Agregar título y etiquetas en el gráfico
Python3
# adds the title plt.title('Correlation') # plot the data plt.scatter(x, y) # fits the best fitting line to the data plt.plot(np.unique(x), np.poly1d(np.polyfit(x, y, 1)) (np.unique(x)), color='red') # Labelling axes plt.xlabel('x axis') plt.ylabel('y axis')
Producción:
Trazar utilizando mapas de calor
Hay muchas maneras de trazar arrays de correlación, una forma eficiente es usar el mapa de calor. Es muy fácil entender la correlación usando mapas de calor , indica la correlación de una característica (variable) con todas las demás características (variable). En otras palabras, una array de correlación es un dato tabular que representa las ‘correlaciones’ entre pares de variables en un dato dado.
Python3
import seaborn as sns # checking correlation using heatmap #Loading dataset flights = sns.load_dataset("flights") #ploting the heatmap for correlation ax = sns.heatmap(flights.corr(), annot=True)
Producción:
Publicación traducida automáticamente
Artículo escrito por prachibindal2925 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA