¿Cómo hacer un gráfico ECDF con Seaborn en Python?

Prerrequisitos:   Seaborn

En este artículo, vamos a hacer el gráfico ECDF con Seaborn Library.

Parcela ECDF

  • ECDF significa Distribución Conmutativa Empírica. Es más probable que se use en lugar del histograma para visualizar los datos porque el gráfico ECDF visualiza todos y cada uno de los puntos de datos del conjunto de datos directamente, lo que facilita que el usuario interactúe con el gráfico.
  • Este gráfico contiene más información porque no tiene una configuración de tamaño de contenedor, lo que significa que no tiene ningún parámetro de suavizado.
  • Dado que sus curvas aumentan monótonamente, es muy adecuado para comparar múltiples distribuciones al mismo tiempo.
  • En una gráfica ECDF, el eje x corresponde al rango de valores de la variable, mientras que el eje y corresponde a la proporción de puntos de datos que son menores o iguales al valor correspondiente del eje x.
  • Podemos hacer el gráfico ECDF directamente usando la función ecdfplot(), o también podemos hacer el gráfico usando la función displot() con la nueva versión de Seaborn.

Instalación:

Para instalar la biblioteca Seaborn, escriba el siguiente comando en su símbolo del sistema.

pip install seaborn

Esta función ECDF plot and displot() está disponible solo en la nueva versión de Seaborn que es la versión 0.11.0 o superior. Si ya instaló Seaborn, actualícelo escribiendo el siguiente comando.

pip install seaborn==0.11.0

Para una mejor comprensión de la trama ECDF. Grafiquemos y hagamos algunos ejemplos usando los conjuntos de datos.

Enfoque paso a paso:

  • Importa la biblioteca seaborn.
  • Cree o cargue el conjunto de datos desde la biblioteca marina.
  • Seleccione la columna para la que está trazando el gráfico ECDF.
  • Para trazar el gráfico ECDF, hay dos formas que son las siguientes:
  • La primera forma es usar la función ecdfplot() para trazar directamente el gráfico ECDF y en la función pasarle los datos y el nombre de la columna en la que está trazando.

Sintaxis:

seaborn.ecdfplot(data=’dataframe’,x=’column_name’,y=’column_name’, hue=’color_column’)

  • La segunda forma es usar la función displot() y pasar sus datos y la columna en la que está haciendo el gráfico y pasar el parámetro de displot kind=’ecdf’.

Sintaxis:

seaborn.displot(data=’dataframe’, x=’column_name’,y=’column_name’ kind=’type_of_plot’,hue=’color_column’, palette=’color’

La siguiente tabla muestra la lista de parámetros utilizados en este artículo.

Parámetro Descripción
datos Marco de datos o numpy.ndarray
X Clave los vectores en los datos o el nombre de la columna en la que se realiza el gráfico.
y Clave los vectores en los datos o el nombre de la columna en la que se realiza el gráfico.
matiz Para determinar el color de la variable de la trama.
paleta

Este parámetro se utiliza para elegir el color al mapear el tono. 

Puede ser string, lista, dict.

tipo Es el parámetro de displot(), usado para dar el tipo de gráfico que queremos.

Método 1: Usar el método ecdfplot()

En este método, estamos utilizando datos de ‘ejercicio’ proporcionados por Seaborn.

Python

# importing library
import seaborn as sns
  
# loading exercise dataset provided by seaborn
excr = sns.load_dataset('exercise')
  
# printing the dataset
print(excr)

Producción:

Ejemplo 1: hacer un gráfico ECDF utilizando un conjunto de datos de ejercicio proporcionado por Seaborn.

Python

# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
  
# loading exercise dataset provided by seaborn
excr = sns.load_dataset('exercise')
  
# making ECDF plot 
sns.ecdfplot(data=excr,x='pulse')
  
# visualizing the plot using matplotlib.pyplot 
# show() function
plt.show()

Producción:

Ejemplo 2: hacer un gráfico ECDF intercambiando el eje del gráfico.

Python

# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
  
# loading exercise dataset provided by seaborn
excr = sns.load_dataset('exercise')
  
# making ECDF plot 
sns.ecdfplot(data=excr,y='pulse')
  
# visualizing the plot using matplotlib.pyplot
# show() function
plt.show()

Producción:

Ejemplo 3: Hacer un gráfico ECDF cuando tenemos múltiples distribuciones.

Python

# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
  
# loading exercise dataset provided by seaborn
excr = sns.load_dataset('exercise')
  
# making ECDF plot when we have multiple 
# distributions
sns.ecdfplot(data=excr, x='pulse', hue='kind')
  
# visualizing the plot using matplotlib.pyplot 
# show() function
plt.show()

Producción:

El gráfico anterior muestra la distribución de la frecuencia del pulso de las personas con respecto al tipo, es decir, descansar, caminar, correr.

Método 2: Usar el método displot()

En este método, estamos utilizando datos de ‘diamantes’ proporcionados por seaborn.

Python

# importing library
import seaborn as sns
  
# loading diamonds dataset provided by seaborn
diam = sns.load_dataset('diamonds')
  
# printing the dataset
print(diam)

Producción:

Ejemplo 1: Trazado del gráfico ECDF usando displot() en el conjunto de datos de pingüinos proporcionado por seaborn.

Python

# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
  
# loading diamonds dataset provided by seaborn
diam = sns.load_dataset('diamonds')
  
# making ECDF plot using displot() on depth 
# of the diamonds
sns.displot(data=diam,x='depth',kind='ecdf')
  
# visualizing the plot using matplotlib.pyplot 
# show() function
plt.show()

Producción:

Ejemplo 2: Trazar el gráfico ECDF usando displot() cuando tenemos varias distribuciones con la configuración predeterminada.

Python

# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
  
# loading diamonds dataset provided by seaborn
diam = sns.load_dataset('diamonds')
  
# making ECDF plot using displot() on depth
# of the diamond on the basis of cut
sns.displot(data=diam,x='depth',kind='ecdf',hue='cut')
  
# visualizing the plot using matplotlib.pyplot
# show() function
plt.show()

Producción:

El gráfico anterior muestra la profundidad de los diamantes en función de su corte.

Ejemplo 3: hacer un gráfico ECDF usando displot() configurando el color.

Python

# importing libraries
import seaborn as sns
import matplotlib.pyplot as plt
  
# loading diamonds dataset provided by seaborn
diam = sns.load_dataset('diamonds')
  
# making ECDF plot using displot() on table 
# column on the basis of cut of diamond
# setting up the color of plot by setting
# up the palette to icefire_r
sns.displot(data=diam,x='table',kind='ecdf',hue='cut',palette='icefire_r')
  
# visualizing the plot using matplotlib.pyplot
# show() function
plt.show()

Producción:

Podemos configurar la paleta a Accent_r, magma_r, plasma, plasma_r, etc, según nuestra elección, tiene muchas otras opciones disponibles.

Publicación traducida automáticamente

Artículo escrito por srishivansh5404 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *