Seaborn es una increíble biblioteca de visualización para el trazado de gráficos estadísticos en Python. Proporciona hermosos estilos predeterminados y paletas de colores para hacer que los gráficos estadísticos sean más atractivos. Está construido en la parte superior de la biblioteca matplotlib y también está estrechamente integrado en las estructuras de datos de pandas .
Seaborn tiene como objetivo hacer que la visualización sea la parte central de la exploración y comprensión de los datos. Proporciona API orientadas a conjuntos de datos, de modo que podemos cambiar entre diferentes representaciones visuales para las mismas variables para una mejor comprensión del conjunto de datos.
Box Plot es la representación visual de los grupos de representación de datos numéricos a través de sus cuartiles. Boxplot también se usa para detectar el valor atípico en el conjunto de datos. Captura el resumen de los datos de manera eficiente con un simple cuadro y bigotes y nos permite comparar fácilmente entre grupos. Boxplot resume los datos de muestra utilizando los percentiles 25, 50 y 75. Estos percentiles también se conocen como el cuartil inferior, la mediana y el cuartil superior.
En este artículo, discutiremos cómo ordenar un diagrama de caja manualmente.
Conjunto de datos utilizado
El conjunto de datos utilizado en el siguiente ejemplo es https://www.kaggle.com/ranjeetjain3/seaborn-tips-dataset
Enfoque paso a paso:
- Importar bibliotecas
Python3
# import required modules import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns
- Cargar conjunto de datos
Python3
# load dataset tips= sns.load_dataset('tips') # display top most rows tips.head()
Producción:
- Trace el diagrama de caja.
Python3
# illustrate box plot fx = sns.boxplot(x='day', y='total_bill', data=tips, hue='sex', palette='Set2')
Producción:
- Trazar el diagrama de caja usando seaborn . Vea la diferencia en el orden de la figura anterior y después de configurar el orden según nuestras necesidades. La paleta cambiará el color del gráfico (también puede probar Set1 y Set3 )
Python3
# illustrating box plot with order fx = sns.boxplot(x='day', y='total_bill', data=tips, order=[ 'Sun', 'Sat', 'Fri', 'Thur'], hue='sex', palette='Set2')
Producción:
- Ambos gráficos juntos:
A continuación se muestra el programa completo basado en el enfoque anterior:
Ejemplo 1
Python3
# import required modules import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # load dataset tips= sns.load_dataset('tips') # display top most rows tips.head() # illustrating box plot with order sns.boxplot(x='day', y='total_bill', data=tips, order=[ 'Sun', 'Sat', 'Fri', 'Thur'], hue='sex', palette='Set2')
Producción:
Ejemplo 2
Ahora, trazando el diagrama de caja usando diferentes características. Observe el orden en el eje x en la siguiente figura:
Python3
# import required modules import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # load dataset tips = sns.load_dataset('tips') # display top most rows tips.head() # plotting the boxplot taking time on x-axis fx = sns.boxplot(x="time", y="total_bill", hue="smoker", data=tips, palette="Set1") # illustrating box plot with order ax = sns.boxplot(x="time", y="total_bill", hue="smoker", order=['Dinner', 'Lunch'], data=tips, palette="Set1")
Producción:
- Antes-
- Después-
Aquí hemos ordenado manualmente el diagrama de caja.
Publicación traducida automáticamente
Artículo escrito por prachibindal2925 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA