Los gráficos de densidad son una variación de los histogramas que se utilizan para observar la distribución de una variable en un conjunto de datos durante un intervalo continuo o un período de tiempo. Los picos de un gráfico de densidad indican dónde se concentran los valores en un intervalo.
En comparación con los histogramas, los gráficos de densidad son mejores para determinar la forma de distribución porque no se ven afectados por la cantidad de contenedores.
Gráfico de densidad en Python usando Altair
Podemos hacer un diagrama de densidad en python usando las bibliotecas Pandas y Altair.
- Altair -Es una librería de visualización estadística basada en Vega y Vega-lite.
- Pandas : es una herramienta de análisis y manipulación de datos de código abierto en Python.
Nota: Usaremos el conjunto de datos ‘insurance.csv’ que se puede descargar desde Google Drive .
Primero, importemos estas bibliotecas usando-
Python3
import pandas as p # loading pandas library import altair as a # loading altair library
A continuación, cargamos el conjunto de datos en el que necesitamos usar el gráfico de densidad.
Python3
data_set = 'insurance.csv' # dataset name d = p.read_csv(data_set) # reading the datasaet d.head() # printing the first 5 data entries
Producción:
Como puede ver, hay siete columnas en el conjunto de datos. Usaremos «cargas» para hacer un gráfico de densidad. Para hacerlo, primero debemos transformar nuestros datos en densidad. Esto se hace usando la función transform_density(). Los parámetros son la variable de interés y un nombre para indicar la variable transformada que se escribe como “as_=[‘Charges’, ‘density’]”. Juntándolo-
Python3
# loading a single column into # the data frame object d = d[["charges"]] a.Chart(d).transform_density('charges', as_=['CHARGES', 'DENSITY'], ).mark_area(color='green').encode( x="CHARGES:Q", y='DENSITY:Q', )
Producción:
Script completo: aquí está el código con todos los pasos en un solo lugar:
Python3
import pandas as p # loading pandas library import altair as a # loading altair library # download dataset from https://drive.google.com/drive/folders/1Dddv1l9hpEPVWh_uuK9Iv1A1xUNy55v7?usp=sharing # OR replace name with your own dataset. data_set = 'insurance.csv' d = p.read_csv(data_set) d = d[["charges"]] a.Chart(d).transform_density('charges', as_=['CHARGES', 'DENSITY'], ).mark_area(color='green').encode( x="CHARGES:Q", y='DENSITY:Q', )
Producción:
Publicación traducida automáticamente
Artículo escrito por shreyaraj1234 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA