Seaborn es una biblioteca de visualización de datos de Python basada en Matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos. Este artículo trata sobre las gráficas de distribución en Seaborn, que se utiliza para examinar distribuciones univariadas y bivariadas. En este artículo discutiremos 4 tipos de parcelas de distribución, a saber:
- parcela conjunta
- distraer
- Parcela
- diagrama de rugosidad
Además de proporcionar diferentes tipos de gráficos de visualización, Seaborn también contiene algunos conjuntos de datos integrados. Usaremos el conjunto de datos de consejos en este artículo. El conjunto de datos de «propinas» contiene información sobre las personas que probablemente comieron en un restaurante y si dejaron una propina o no, su edad, sexo, etc. Echémosle un vistazo.
Código:
# import thr necessary libraries import seaborn as sns import matplotlib.pyplot as plt % matplotlib inline # to ignore the warnings from warnings import filterwarnings # load the dataset df = sns.load_dataset('tips') # the first five entries of the dataset df.head()
Now, lets proceed onto the plots.
Desplegar
Se utiliza básicamente para un conjunto univariante de observaciones y lo visualiza a través de un histograma, es decir, solo una observación y, por lo tanto, elegimos una columna particular del conjunto de datos.
Sintaxis:
distplot(a[, bins, hist, kde, rug, fit, ...])
Ejemplo:
# set the background style of the plot sns.set_style('whitegrid') sns.distplot(df['total_bill'], kde = False, color ='red', bins = 30)
Producción:
Explicación:
- KDE significa Kernel Density Estimation y ese es otro tipo de trama en seaborn.
- bins se usa para establecer la cantidad de contenedores que desea en su gráfico y en realidad depende de su conjunto de datos.
- color se utiliza para especificar el color de la trama
Ahora, mirando esto, podemos decir que la mayor parte de la factura total dada se encuentra entre 10 y 20.
Parcela conjunta
Se utiliza para dibujar un gráfico de dos variables con gráficos bivariados y univariados. Básicamente combina dos tramas diferentes.
Sintaxis:
jointplot(x, y[, data, kind, stat_func, ...])
Ejemplo:
sns.jointplot(x ='total_bill', y ='tip', data = df)
Producción:
sns.jointplot(x ='total_bill', y ='tip', data = df, kind ='kde') # KDE shows the density where the points match up the most
Explicación:
- kind es una variable que nos ayuda a jugar con el hecho de cómo desea visualizar los datos. Ayuda a ver qué sucede dentro del diagrama de unión. El valor predeterminado es dispersión y puede ser hexadecimal, reg (regresión) o kde.
- x e y son dos strings que son los nombres de las columnas y los datos que contiene la columna se usan al especificar el parámetro de datos.
- aquí podemos ver las propinas en el eje y y la factura total en el eje x, así como una relación lineal entre los dos que sugiere que la factura total aumenta con las propinas.
Diagrama de pares
Representa la relación por pares en todo el marco de datos y admite un argumento adicional llamado matiz para la separación categórica. Básicamente, lo que hace es crear un gráfico conjunto entre todas las columnas numéricas posibles y lleva un tiempo si el marco de datos es realmente enorme.
Sintaxis:
pairplot(data[, hue, hue_order, palette, …])
Ejemplo:
sns.pairplot(df, hue ="sex", palette ='coolwarm')
Salida:
Explicación:
- hue establece la separación categórica entre las entradas del conjunto de datos.
- La paleta se utiliza para diseñar las parcelas.
diagrama de alfombra
Traza puntos de datos en una array como palos en un eje. Al igual que un diagrama de distribución, toma una sola columna. En lugar de dibujar un histograma, crea guiones en todo el gráfico. Si lo compara con el gráfico conjunto, puede ver que lo que hace un gráfico conjunto es que cuenta los guiones y los muestra como contenedores.
Sintaxis:
rugplot(a[, height, axis, ax])
Ejemplo:
sns.rugplot(df['total_bill'])
Producción:
Publicación traducida automáticamente
Artículo escrito por Choco_Chips y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA