Gráfico de dispersión con histogramas marginales en Python con Seaborn

Prerrequisitos : Seaborn 

El gráfico de dispersión con histogramas marginales es básicamente un gráfico de distribución conjunta con las distribuciones marginales de las dos variables. En la visualización de datos, a menudo trazamos el comportamiento conjunto de dos variables aleatorias (distribución bivariada) o cualquier número de variables aleatorias. Pero si los datos son demasiado grandes, la superposición puede ser un problema. Por lo tanto, para distinguir entre variables, es útil tener la distribución de probabilidad de cada variable al lado de la gráfica conjunta. Esta distribución de probabilidad individual de una variable aleatoria se denomina distribución de probabilidad marginal. 

En seaborn, esto se facilita con jointplot() . Representa la distribución bivariada usando scatterplot() y las distribuciones marginales usando histplot()

Acercarse

  • Importar biblioteca marina
  • Cargue el conjunto de datos de su elección
  • Use jointplot() en variables de su conjunto de datos

Ejemplo 1: 

Python3

# importing and creating alias for seaborn
import seaborn as sns
  
# loading tips dataset
tips = sns.load_dataset("tips")
  
# plotting scatterplot with histograms for features total bill and tip.
sns.jointplot(data=tips, x="total_bill", y="tip")

Producción : 

<seaborn.axisgrid.JointGrid en 0x26203152688>

diagrama_junto_con_histogramas

Ejemplo 2: Usando el atributo kind=”reg” puede agregar un ajuste de regresión lineal y curvas KDE univariadas.

Python3

import seaborn as sns
  
tips = sns.load_dataset("tips")
  
# here "*" is used as a marker for scatterplot
sns.jointplot(data=tips, x="total_bill", y="tip", kind="reg", marker="*")

Producción :

diagrama de dispersión con un ajuste de regresión lineal

Ejemplo 3: para agregar colores condicionales al diagrama de dispersión, puede usar el atributo de tono, pero dibuja curvas de densidad separadas (usando kdeplot()) en los ejes marginales.

Python3

import seaborn as sns
  
tips = sns.load_dataset("tips")
  
sns.jointplot(data=tips, x="total_bill", y="tip", hue="time")

Producción : 

diagrama de dispersión3

Publicación traducida automáticamente

Artículo escrito por tejalkadam18m y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *