¿Cómo hacer un diagrama de caja con puntos de datos fluctuantes usando Altair en Python?

En este artículo, determinaremos la forma de formar un diagrama de caja con puntos de datos utilizando Altair. La última versión de Altair admite la creación de diagramas de caja simples. Sin embargo, la versión actual de Altair no admite la adición de puntos de datos fluctuantes encima de diagramas de caja. Debido a Justin Bois de Caltech, usaremos su paquete de utilidad de visualización de datos Altair-catplot, haremos diagramas de caja con puntos de datos fluctuantes.

  • Altair : Altair es una biblioteca de visualización estadística en Python. Es de naturaleza declarativa y se basa en las gramáticas de visualización Vega y Vega-Lite. Se está convirtiendo rápidamente en la primera opción de las personas que buscan una forma rápida y eficiente de visualizar conjuntos de datos. Si ha utilizado bibliotecas de visualización imperativas como matplotlib, podrá apreciar correctamente las capacidades de Altair.
  • Catplot: Catplot es una adición relativamente nueva a Seaborn que simplifica el trazado que involucra variables categóricas. En la versión Seaborn v0. 9.0 que salió en julio de 2018, cambió la gráfica de factores anterior a catplot para que sea más consistente con la terminología en pandas y seaborn.
  • Diagrama de caja: podemos crear un diagrama de caja de la siguiente manera. Tenga en cuenta que la marca es una string que especifica un diagrama de caja (como lo será en el futuro con Altair), y la codificación se especifica como un diccionario de pares clave-valor.

Pasos requeridos 

  1. Importar bibliotecas
  2. Importar o crear datos
  3. Utilice el método altair_catplot.catplot() con la transformación jitterbox.
  4. Modifique los valores de diferentes atributos para una mejor visualización (opcional).

Ejemplo 1:

Python3

# importing packages
import altair
import altair_catplot
import seaborn
  
# load data
tip = seaborn.load_dataset('tips')
  
# draw a plot
altair_catplot.catplot(tip,
                       transform ='jitterbox',
                       mark ='point',
                       encoding = dict(x = altair.X('time:N', title = None),
                                     y = altair.Y('total_bill:Q', scale = altair.Scale(zero = False)),
                                     color = altair.Color('time:N', legend = None))
                      )

Producción:

Ejemplo 2:

Python3

# importing packages
import altair
import altair_catplot
import seaborn
  
# load data
tip = seaborn.load_dataset('tips')
  
# draw a plot
altair_catplot.catplot(tip,
                       transform ='jitterbox',
                       mark ='square',
                       encoding = dict(x = altair.X('day:N', title = None),
                                     y = altair.Y('total_bill:Q', scale = altair.Scale(zero = False)),
                                     color = altair.Color('day:N', legend = None))
                      )

Producción:

Ejemplo 3:

Python3

# importing packages
import altair
import altair_catplot
import seaborn
  
# load data
iris = seaborn.load_dataset('iris')
  
# draw a plot
altair_catplot.catplot(iris,
                       transform ='jitterbox',
                       mark ='circle',
                       encoding = dict(x = altair.X('species:N', title = None),
                                     y = altair.Y('sepal_length:Q', scale = altair.Scale(zero = False)),
                                     color = altair.Color('species:N', legend = None))
                      )

Producción:

Publicación traducida automáticamente

Artículo escrito por deepanshu_rustagi y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *