¿Cómo hacer un gráfico de densidad en Python con Altair?

Los gráficos de densidad son una variación de los histogramas que se utilizan para observar la distribución de una variable en un conjunto de datos durante un intervalo continuo o un período de tiempo. Los picos de un gráfico de densidad indican dónde se concentran los valores en un intervalo.

En comparación con los histogramas, los gráficos de densidad son mejores para determinar la forma de distribución porque no se ven afectados por la cantidad de contenedores.

Gráfico de densidad en Python usando Altair

Podemos hacer un diagrama de densidad en python usando las bibliotecas Pandas y Altair.

  • Altair -Es una librería de visualización estadística basada en Vega y Vega-lite.
  • Pandas : es una herramienta de análisis y manipulación de datos de código abierto en Python.

Nota: Usaremos el conjunto de datos ‘insurance.csv’ que se puede descargar desde Google Drive .

Primero, importemos estas bibliotecas usando-

Python3

import pandas as p  # loading pandas library
import altair as a  # loading altair library

A continuación, cargamos el conjunto de datos en el que necesitamos usar el gráfico de densidad.

Python3

data_set = 'insurance.csv'  # dataset name
d = p.read_csv(data_set)  # reading the datasaet
d.head()  # printing the first 5 data entries

Producción:

Como puede ver, hay siete columnas en el conjunto de datos. Usaremos «cargas» para hacer un gráfico de densidad. Para hacerlo, primero debemos transformar nuestros datos en densidad. Esto se hace usando la función transform_density(). Los parámetros son la variable de interés y un nombre para indicar la variable transformada que se escribe como “as_=[‘Charges’, ‘density’]”. Juntándolo-

Python3

# loading a single column into
# the data frame object
d = d[["charges"]]
 
a.Chart(d).transform_density('charges', as_=['CHARGES', 'DENSITY'],
                             ).mark_area(color='green').encode(
    x="CHARGES:Q",
    y='DENSITY:Q',
 
)

Producción:

Producción

Script completo: aquí está el código con todos los pasos en un solo lugar:

Python3

import pandas as p  # loading pandas library
import altair as a  # loading altair library
 
# download dataset from https://drive.google.com/drive/folders/1Dddv1l9hpEPVWh_uuK9Iv1A1xUNy55v7?usp=sharing
# OR replace name with your own dataset.
data_set = 'insurance.csv'
d = p.read_csv(data_set)
d = d[["charges"]]
 
a.Chart(d).transform_density('charges', as_=['CHARGES', 'DENSITY'],
                             ).mark_area(color='green').encode(
    x="CHARGES:Q",
    y='DENSITY:Q',
)

Producción:

Producción

Publicación traducida automáticamente

Artículo escrito por shreyaraj1234 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *