Seaborn es una biblioteca de Python que se basa en matplotlib y se utiliza para la visualización de datos. Proporciona un medio para presentar datos en un formato de gráfico estadístico como un medio informativo y atractivo para impartir alguna información. Un mapa de calor es uno de los componentes admitidos por seaborn donde la variación en los datos relacionados se representa mediante una paleta de colores. Este artículo se centra principalmente en un mapa de calor de correlación y cómo se puede usar seaborn en combinación con pandas y matplotlib para generar uno para un marco de datos.
Instalación
Como cualquier otra biblioteca de Python, seaborn se puede instalar fácilmente usando pip:
pip install seaborn
Esta biblioteca es parte de la distribución de Anaconda y, por lo general, funciona solo con la importación si su IDE es compatible con Anaconda, pero también se puede instalar con el siguiente comando:
conda install seaborn
Mapa de calor de correlación
Un mapa de calor de correlación es un mapa de calor que muestra una array de correlación 2D entre dos dimensiones discretas, utilizando celdas de colores para representar datos de una escala generalmente monocromática. Los valores de la primera dimensión aparecen como filas de la tabla mientras que los de la segunda dimensión como columna. El color de la celda es proporcional al número de medidas que coinciden con el valor dimensional. Esto hace que los mapas de calor de correlación sean ideales para el análisis de datos, ya que hace que los patrones sean fáciles de leer y resalta las diferencias y variaciones en los mismos datos. Un mapa de calor de correlación, como un mapa de calor normal, está asistido por una barra de colores que hace que los datos sean fácilmente legibles y comprensibles.
Los siguientes pasos muestran cómo se puede producir un mapa de calor de correlación:
- Importe primero todos los módulos requeridos
- Importa el archivo donde se almacenan tus datos
- Trazar un mapa de calor
- Mostrarlo usando matplotlib
Para trazar el método de mapa de calor del módulo seaborn se utilizará.
Sintaxis: mapa de calor (datos, vmin, vmax, centro, cmap,……………………………………………………)
A excepción de los datos, todos los demás atributos son opcionales y, obviamente, los datos serán los datos que se trazarán. Los datos aquí deben pasarse con el método corr() para generar un mapa de calor de correlación. Además, corr() en sí mismo elimina las columnas que no serán de utilidad mientras genera un mapa de calor de correlación y selecciona aquellas que se pueden usar.
Ejemplo 1:
Para el ejemplo que se proporciona a continuación, aquí se utiliza un conjunto de datos descargado de kaggle.com. La trama muestra datos relacionados con las novelas más vendidas en amazon.
Conjunto de datos utilizado: los más vendidos
Python3
# import modules import matplotlib.pyplot as mp import pandas as pd import seaborn as sb # import file with data data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\bestsellers.csv") # prints data that will be plotted # columns shown here are selected by corr() since # they are ideal for the plot print(data.corr()) # plotting correlation heatmap dataplot = sb.heatmap(data.corr(), cmap="YlGnBu", annot=True) # displaying heatmap mp.show()
Producción:
El ejemplo anterior trata con datos pequeños. El siguiente ejemplo muestra cómo se verá la salida para un gran conjunto de datos,
Ejemplo 2:
El conjunto de datos utilizado en este ejemplo es un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA.
Conjunto de datos utilizado: acumulativo
Python3
# import modules import matplotlib.pyplot as mp import pandas as pd import seaborn as sb # import file with data data=pd.read_csv("C:\\Users\\Vanshi\\Desktop\\cumulative.csv") # plotting correlation heatmap dataplot=sb.heatmap(data.corr()) # displaying heatmap mp.show()
Producción:
Publicación traducida automáticamente
Artículo escrito por vanshikagoyal43 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA