Seaborn Kdeplot: una guía completa

El gráfico de estimación de densidad del kernel (KDE)  y Kdeplot nos permiten estimar la función de densidad de probabilidad de la curva continua o no paramétrica de nuestro conjunto de datos en una o más dimensiones, lo que significa que podemos crear un gráfico único para varias muestras, lo que ayuda en más visualización eficiente de datos.

Para usar el módulo Seaborn, necesitamos instalar el módulo usando el siguiente comando:

pip install seaborn

Sintaxis: seaborn.kdeplot(x=Ninguno, *, y=Ninguno, vertical=Falso, palette=Ninguno, **kwargs)

Parámetros:

x, y : vectores o claves en datos

vertical: booleano (Verdadero o Falso)

datos: pandas.DataFrame, numpy.ndarray, mapeo o secuencia

Aprendemos el uso de algunos parámetros a través de algunos ejemplos específicos:

Primero importa la biblioteca correspondiente

Python3

import pandas as pd
import seaborn as sb
import numpy as np
from matplotlib import pyplot as plt
%matplotlib inline

Dibuje una imagen kde unidimensional simple:

Veamos el Kde de nuestra variable eje x y eje y, así que pasemos la variable x a los métodos kdeplot().

Python3

# data x and y axis for seaborn
x= np.random.randn(200)
y = np.random.randn(200)
  
# Kde for x var
sns.kdeplot(x)

Producción:

Luego, después de verificar el eje y.

Python3

sns.kdeplot(y)

Producción:

Use Sombra para llenar el área cubierta por la curva:  

Podemos resaltar la parcela sombreando el área cubierta por la curva. Si es True, el procesamiento de sombras se realiza en el área debajo de la curva kde y el color controla el color de la curva y la sombra.

Python3

sns.kdeplot(x, shade = True)

Producción:

Puede cambiar el color de sombra con atributos de color :

Python3

sns.kdeplot(x, shade = True , color = "Green")

Producción:

Usar Vertical para dibujar indica si dibujar en el eje X o en el eje Y

Python3

sns.kdeplot(x, vertical = True)

Producción:

Kdeplot bivariado para dos variables: 

Simplemente pase las dos variables a los métodos seaborn.kdeplot().

Python3

sns.kdeplot(x,y)

Producción:

Sombrea el área cubierta por una curva con atributos de sombra :

Python3

sns.kdeplot(x,y, shade = True)

Producción:

Ahora puedes cambiar el color con los atributos cmap :

Python3

sns.kdeplot(x,y, cmap = "winter_r")

Producción:

Uso de Cbar: si es verdadero, agregue una barra de colores para anotar el mapeo de colores en un gráfico bivariado. Nota: actualmente no es compatible con parcelas con una variable de matiz.

Python3

sns.kdeplot(x, y, shade=True, cbar=True)

Producción:

Veamos el ejemplo con Iris Dataset, que es una distribución de gráficos para cada columna de un conjunto de datos de formato ancho:

El conjunto de datos de iris consta de 3 tipos diferentes de longitud de pétalos y sépalos de iris (Setosa, Versicolor y Virginica), almacenados en un numpy.ndarray de 150 × 4

Cargando el conjunto de datos del iris para Kdeplot:

Python3

iris = sns.load_dataset('iris')
iris

Producción:

Kdeplot bivariado para dos variables de iris:

Una vez que hayamos establecido las especies, si queremos simplemente calcular petal_length y petal_width, simplemente pase las dos variables (Setosa y verginica) a los métodos seaborn.kdeplot().

Python3

setosa = iris.loc[iris.species=="setosa"]
virginica = iris.loc[iris.species == "virginica"]
sns.kdeplot(setosa.petal_length, setosa.petal_width)

Producción:

Vea otro ejemplo si queremos calcular otro atributo variable que es sepal_width y sepal_length.

Python3

sns.kdeplot(setosa.sepal_width, setosa.sepal_length)

Producción:

Si pasamos los dos Kdeplot separados con diferente variable:

Python3

sns.kdeplot(setosa.petal_length, setosa.petal_width)
sns.kdeplot(virginica.petal_length, virginica.petal_width)

Producción:

Publicación traducida automáticamente

Artículo escrito por kumar_satyam y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *