Mapa de calor agrupado jerárquicamente en Python con Seaborn Clustermap

Seaborn es una increíble biblioteca de visualización para el trazado de gráficos estadísticos en Python. Proporciona hermosos estilos predeterminados y paletas de colores para hacer que los gráficos estadísticos sean más atractivos. Está construido en la parte superior de la biblioteca matplotlib y también está estrechamente integrado en las estructuras de datos de pandas

¿Qué es la agrupación?

El agrupamiento consiste básicamente en agrupar datos en función de las relaciones entre las variables de los datos. Los algoritmos de agrupamiento ayudan a obtener datos estructurados en el aprendizaje no supervisado. Los tipos más comunes de agrupamiento se muestran a continuación.

tipos_de_agrupamiento

Aquí vamos a ver el agrupamiento jerárquico, especialmente el agrupamiento jerárquico aglomerativo (de abajo hacia arriba). En el agrupamiento aglomerativo, comenzamos considerando cada punto de datos como un grupo y luego combinamos repetidamente dos grupos más cercanos en grupos más grandes hasta que nos quedamos con un solo grupo. El gráfico que trazamos después de realizar un agrupamiento aglomerativo en los datos se llama Dendrograma.

Trazado de mapas de calor agrupados jerárquicamente

En cuanto al mapa de calor, es una representación gráfica de datos donde los valores se representan usando colores. La variación en la intensidad del color representa cómo se agrupan los datos o cómo varía en el espacio.

La función clustermap() de seaborn traza un mapa de calor agrupado jerárquicamente del conjunto de datos de array dado. Devuelve un índice de cuadrícula agrupado. 

A continuación se muestran algunos ejemplos que representan el mapa de calor agrupado jerárquicamente de un conjunto de datos:

En el conjunto de datos Vuelos , los datos (Número de pasajeros) se agrupan según el mes y el año:

Ejemplo 1: 

Python3

# Importing the library
import seaborn as sns
from sunbird.categorical_encoding import frequency_encoding
  
# Load dataset
data = sns.load_dataset('flights')
  
# Categorical encoding
frequency_encoding(data, 'month')
  
# Clustering data row-wise and
# changing color of the map.
sns.clustermap(data, figsize=(7, 7))

Producción :

La leyenda a la izquierda del mapa de grupos indica información sobre el mapa de grupos, por ejemplo, el color brillante indica más pasajeros y el color oscuro indica menos pasajeros.     

Ejemplo 2:

Python3

# Importing the library
import seaborn as sns
from sunbird.categorical_encoding import frequency_encoding
  
# Load dataset
data = sns.load_dataset('flights')
  
# Categorical encoding
frequency_encoding(data, 'month')
  
# Clustering data row-wise and
# changing color of the map.
sns.clustermap(data, cmap='coolwarm', figsize=(7, 7))

Producción:

Aquí hemos cambiado los colores del mapa del clúster.

Publicación traducida automáticamente

Artículo escrito por tejalkadam18m y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *