El gráfico de estimación de densidad del kernel (KDE) y Kdeplot nos permiten estimar la función de densidad de probabilidad de la curva continua o no paramétrica de nuestro conjunto de datos en una o más dimensiones, lo que significa que podemos crear un gráfico único para varias muestras, lo que ayuda en más visualización eficiente de datos.
Para usar el módulo Seaborn, necesitamos instalar el módulo usando el siguiente comando:
pip install seaborn
Sintaxis: seaborn.kdeplot(x=Ninguno, *, y=Ninguno, vertical=Falso, palette=Ninguno, **kwargs)
Parámetros:
x, y : vectores o claves en datos
vertical: booleano (Verdadero o Falso)
datos: pandas.DataFrame, numpy.ndarray, mapeo o secuencia
Aprendemos el uso de algunos parámetros a través de algunos ejemplos específicos:
Primero importa la biblioteca correspondiente
Python3
import pandas as pd import seaborn as sb import numpy as np from matplotlib import pyplot as plt %matplotlib inline
Dibuje una imagen kde unidimensional simple:
Veamos el Kde de nuestra variable eje x y eje y, así que pasemos la variable x a los métodos kdeplot().
Python3
# data x and y axis for seaborn x= np.random.randn(200) y = np.random.randn(200) # Kde for x var sns.kdeplot(x)
Producción:
Luego, después de verificar el eje y.
Python3
sns.kdeplot(y)
Producción:
Use Sombra para llenar el área cubierta por la curva:
Podemos resaltar la parcela sombreando el área cubierta por la curva. Si es True, el procesamiento de sombras se realiza en el área debajo de la curva kde y el color controla el color de la curva y la sombra.
Python3
sns.kdeplot(x, shade = True)
Producción:
Puede cambiar el color de sombra con atributos de color :
Python3
sns.kdeplot(x, shade = True , color = "Green")
Producción:
Usar Vertical para dibujar indica si dibujar en el eje X o en el eje Y
Python3
sns.kdeplot(x, vertical = True)
Producción:
Kdeplot bivariado para dos variables:
Simplemente pase las dos variables a los métodos seaborn.kdeplot().
Python3
sns.kdeplot(x,y)
Producción:
Sombrea el área cubierta por una curva con atributos de sombra :
Python3
sns.kdeplot(x,y, shade = True)
Producción:
Ahora puedes cambiar el color con los atributos cmap :
Python3
sns.kdeplot(x,y, cmap = "winter_r")
Producción:
Uso de Cbar: si es verdadero, agregue una barra de colores para anotar el mapeo de colores en un gráfico bivariado. Nota: actualmente no es compatible con parcelas con una variable de matiz.
Python3
sns.kdeplot(x, y, shade=True, cbar=True)
Producción:
Veamos el ejemplo con Iris Dataset, que es una distribución de gráficos para cada columna de un conjunto de datos de formato ancho:
El conjunto de datos de iris consta de 3 tipos diferentes de longitud de pétalos y sépalos de iris (Setosa, Versicolor y Virginica), almacenados en un numpy.ndarray de 150 × 4
Cargando el conjunto de datos del iris para Kdeplot:
Python3
iris = sns.load_dataset('iris') iris
Producción:
Kdeplot bivariado para dos variables de iris:
Una vez que hayamos establecido las especies, si queremos simplemente calcular petal_length y petal_width, simplemente pase las dos variables (Setosa y verginica) a los métodos seaborn.kdeplot().
Python3
setosa = iris.loc[iris.species=="setosa"] virginica = iris.loc[iris.species == "virginica"] sns.kdeplot(setosa.petal_length, setosa.petal_width)
Producción:
Vea otro ejemplo si queremos calcular otro atributo variable que es sepal_width y sepal_length.
Python3
sns.kdeplot(setosa.sepal_width, setosa.sepal_length)
Producción:
Si pasamos los dos Kdeplot separados con diferente variable:
Python3
sns.kdeplot(setosa.petal_length, setosa.petal_width) sns.kdeplot(virginica.petal_length, virginica.petal_width)
Producción:
Publicación traducida automáticamente
Artículo escrito por kumar_satyam y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA