nacido en el mar | Parcelas de Distribución

Seaborn es una biblioteca de visualización de datos de Python basada en Matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos. Este artículo trata sobre las gráficas de distribución en Seaborn, que se utiliza para examinar distribuciones univariadas y bivariadas. En este artículo discutiremos 4 tipos de parcelas de distribución, a saber:

  1. parcela conjunta
  2. distraer
  3. Parcela
  4. diagrama de rugosidad

Además de proporcionar diferentes tipos de gráficos de visualización, Seaborn también contiene algunos conjuntos de datos integrados. Usaremos el conjunto de datos de consejos en este artículo. El conjunto de datos de «propinas» contiene información sobre las personas que probablemente comieron en un restaurante y si dejaron una propina o no, su edad, sexo, etc. Echémosle un vistazo.

Código:

# import thr necessary libraries
import seaborn as sns
import matplotlib.pyplot as plt % matplotlib inline
  
# to ignore the warnings 
from warnings import filterwarnings
  
# load the dataset
df = sns.load_dataset('tips')
  
# the first five entries of the dataset
df.head()


Now, lets proceed onto the plots.
 

Desplegar

Se utiliza básicamente para un conjunto univariante de observaciones y lo visualiza a través de un histograma, es decir, solo una observación y, por lo tanto, elegimos una columna particular del conjunto de datos.
Sintaxis:

distplot(a[, bins, hist, kde, rug, fit, ...])

Ejemplo:

# set the background style of the plot
sns.set_style('whitegrid')
sns.distplot(df['total_bill'], kde = False, color ='red', bins = 30)

Producción:

Explicación:

  • KDE significa Kernel Density Estimation y ese es otro tipo de trama en seaborn.
  • bins se usa para establecer la cantidad de contenedores que desea en su gráfico y en realidad depende de su conjunto de datos.
  • color se utiliza para especificar el color de la trama

Ahora, mirando esto, podemos decir que la mayor parte de la factura total dada se encuentra entre 10 y 20.

Parcela conjunta

Se utiliza para dibujar un gráfico de dos variables con gráficos bivariados y univariados. Básicamente combina dos tramas diferentes.
Sintaxis:

jointplot(x, y[, data, kind, stat_func, ...])    

Ejemplo:

sns.jointplot(x ='total_bill', y ='tip', data = df)

Producción:

sns.jointplot(x ='total_bill', y ='tip', data = df, kind ='kde')
# KDE shows the density where the points match up the most

Explicación:

  • kind es una variable que nos ayuda a jugar con el hecho de cómo desea visualizar los datos. Ayuda a ver qué sucede dentro del diagrama de unión. El valor predeterminado es dispersión y puede ser hexadecimal, reg (regresión) o kde.
  • x e y son dos strings que son los nombres de las columnas y los datos que contiene la columna se usan al especificar el parámetro de datos.
  • aquí podemos ver las propinas en el eje y y la factura total en el eje x, así como una relación lineal entre los dos que sugiere que la factura total aumenta con las propinas.
    •  

      Diagrama de pares

      Representa la relación por pares en todo el marco de datos y admite un argumento adicional llamado matiz para la separación categórica. Básicamente, lo que hace es crear un gráfico conjunto entre todas las columnas numéricas posibles y lleva un tiempo si el marco de datos es realmente enorme.

      Sintaxis:

pairplot(data[, hue, hue_order, palette, …])    

Ejemplo:

sns.pairplot(df, hue ="sex", palette ='coolwarm')

Salida:

Explicación:

  • hue establece la separación categórica entre las entradas del conjunto de datos.
  • La paleta se utiliza para diseñar las parcelas.

diagrama de alfombra

Traza puntos de datos en una array como palos en un eje. Al igual que un diagrama de distribución, toma una sola columna. En lugar de dibujar un histograma, crea guiones en todo el gráfico. Si lo compara con el gráfico conjunto, puede ver que lo que hace un gráfico conjunto es que cuenta los guiones y los muestra como contenedores.

Sintaxis:

rugplot(a[, height, axis, ax])  

Ejemplo:

sns.rugplot(df['total_bill'])

Producción:

Publicación traducida automáticamente

Artículo escrito por Choco_Chips y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *