Trazado de array de correlación usando Python

Correlación significa una asociación, es una medida de la medida en que dos variables están relacionadas. 

1. Correlación positiva: cuando dos variables aumentan juntas y disminuyen juntas. Están positivamente correlacionados. ‘1’ es una correlación positiva perfecta. Por ejemplo, la demanda y el beneficio están correlacionados positivamente cuanto mayor sea la demanda del producto, mayor será el beneficio, por lo tanto, la correlación positiva.

2. Correlación Negativa: Cuando una variable aumenta y la otra variable disminuye juntas y viceversa. Están negativamente correlacionados. Por ejemplo, si la distancia entre los imanes aumenta, su atracción disminuye y viceversa. Por lo tanto, una correlación negativa. ‘-1’ no hay correlación

3. Correlación cero (sin correlación): cuando dos variables no parecen estar vinculadas en absoluto. ‘0’ es una correlación negativa perfecta. Por ejemplo, la cantidad de té que toma y el nivel de inteligencia.

Trazado de la array de correlación usando Python

Paso 1: Importación de las bibliotecas.

Python3

import sklearn
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

Paso 2: encontrar la correlación entre dos variables.

Python3

y = pd.Series([1, 2, 3, 4, 3, 5, 4])
x = pd.Series([1, 2, 3, 4, 5, 6, 7])
correlation = y.corr(x)
correlation 

Producción:

Paso 3: Trazar el gráfico. Aquí estamos usando diagramas de dispersión. Un diagrama de dispersión es un diagrama donde cada valor en el conjunto de datos está representado por un punto. Además, muestra una relación entre dos variables.

Python3

# plotting the data
plt.scatter(x, y)
  
# This will fit the best line into the graph
plt.plot(np.unique(x), np.poly1d(np.polyfit(x, y, 1))
         (np.unique(x)), color='red')

Producción:

Recuerde los puntos que se explicaron anteriormente. Observe ambas imágenes, encontrará similitudes. Además, observe que el valor de la correlación es cercano a 1, por lo tanto, se refleja la correlación positiva.

Agregar título y etiquetas en el gráfico

Python3

# adds the title
plt.title('Correlation')
  
# plot the data
plt.scatter(x, y)
  
# fits the best fitting line to the data
plt.plot(np.unique(x), 
         np.poly1d(np.polyfit(x, y, 1))
         (np.unique(x)), color='red')
  
# Labelling axes
plt.xlabel('x axis')
plt.ylabel('y axis')

Producción:

Trazar utilizando mapas de calor

Hay muchas maneras de trazar arrays de correlación, una forma eficiente es usar el mapa de calor. Es muy fácil entender la correlación usando mapas de calor , indica la correlación de una característica (variable) con todas las demás características (variable). En otras palabras, una array de correlación es un dato tabular que representa las ‘correlaciones’ entre pares de variables en un dato dado.

Python3

import seaborn as sns
  
# checking correlation using heatmap
#Loading dataset
flights = sns.load_dataset("flights")
  
#ploting the heatmap for correlation
ax = sns.heatmap(flights.corr(), annot=True)

Producción:

Publicación traducida automáticamente

Artículo escrito por prachibindal2925 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *