ML | Gráficos matriciales en Seaborn

Seaborn es una maravillosa biblioteca de visualización proporcionada por Python. Tiene varios tipos de gráficos a través de los cuales proporciona capacidades de visualización sorprendentes. Algunos de ellos incluyen diagrama de conteo, diagrama de dispersión, diagramas de pares, diagramas de regresión, diagramas de array y mucho más. Este artículo trata sobre los diagramas matriciales en seaborn. 
Ejemplo 1: Heatmaps 
Heatmap es una forma de mostrar algún tipo de diagrama de array. Para usar un mapa de calor, los datos deben estar en forma de array. Por array queremos decir que el nombre del índice y el nombre de la columna deben coincidir de alguna manera para que los datos que llenamos dentro de las celdas sean relevantes. Veamos un ejemplo para entender esto mejor.
Código: programa Python 
 

Python3

# import the necessary libraries
import seaborn as sns
import matplotlib.pyplot as plt % matplotlib inline
 
# load the tips dataset
dataset = sns.load_dataset('tips')
 
# first five entries of the tips dataset
dataset.head()
 
# correlation between the different parameters
tc = dataset.corr()
 
# plot a heatmap of the correlated data
sns.heatmap(tc)

Las primeras cinco entradas del conjunto de datos 
 

La array de correlación 
 

Mapa de calor de la array correlacionada 
Para obtener una mejor visualización con el mapa de calor, podemos agregar los parámetros como annot, linewidth y line color. 
 

Python3

# import the necessary libraries
import seaborn as sns
import matplotlib.pyplot as plt % matplotlib inline
 
# load the tips dataset
dataset = sns.load_dataset('tips')
 
# first five entries of the tips dataset
dataset.head()
 
# correlation between the different parameters
tc = dataset.corr()
sns.heatmap(tc, annot = True, cmap ='plasma',
            linecolor ='black', linewidths = 1)

Explicación 
 

  • annot se usa para anotar el valor real que pertenece a estas celdas
  • cmap se usa para el mapeo de color que desea, como coolwarm, plasma, magma, etc.
  • linewidth se usa para establecer el ancho de las líneas que separan las celdas.
  • linecolor se utiliza para establecer el color de las líneas que separan las celdas.

Aquí hay una gráfica que muestra esos atributos. 
 

Entonces podemos decir que todo lo que hace un mapa de calor es colorear las celdas según el gradiente y usa algunos parámetros para aumentar la visualización de datos. 
Ejemplo 2: Mapas 
de conglomerados Los mapas de conglomerados utilizan la agrupación jerárquica. Realiza la agrupación en clústeres en función de la similitud de las filas y columnas. 
 

Python3

# import the necessary libraries
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt % matplotlib inline
 
# load the flights dataset
fd = sns.load_dataset('flights')
 
# make a dataframe of the data
df = pd.pivot_table(values ='passengers', index ='month',
                    columns ='year', data = fd)
 
# first five entries of the dataset
df.head()
 
# make a clustermap from the dataset
sns.clustermap(df, cmap ='plasma')

Las primeras cinco entradas del conjunto de datos 
 

La array creada usando la tabla dinámica (primeras cinco entradas) 
 

Clustermap a partir de los datos proporcionados 
También podemos cambiar la escala de la barra de colores usando el parámetro standard_scale. 
 

Python3

# import the necessary libraries
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt % matplotlib inline
 
# load the flights dataset
fd = sns.load_dataset('flights')
 
# make a dataframe of the data
df = pd.pivot_table(values ='passengers',
                    index ='month', columns ='year', data = fd)
 
# first five entries of the dataset
df.head()
 
# make a clustermap from the dataset
sns.clustermap(df, cmap ='plasma', standard_scale = 1)

Clustermap después de usar el escalado  
estándar standard_scale = 1 normaliza los datos de 0 a 1 rango. Podemos ver que los meses y los años ya no están en orden, ya que se agrupan de acuerdo con la similitud en el caso de clustermaps. 
Entonces, podemos concluir que un mapa de calor mostrará las cosas en el orden que le damos, mientras que el mapa de clúster agrupa los datos en función de la similitud.
 

Publicación traducida automáticamente

Artículo escrito por Choco_Chips y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *