¿Cómo hacer un histograma simple con Altair en Python?

Prerrequisitos: Altair

El Histograma Simple es la representación de la distribución de frecuencias por medio de rectángulos cuyo ancho representa el intervalo de clase. Histograma es la representación gráfica que organiza puntos de datos agrupados en el rango especificado. Al usar el histograma, podemos visualizar una gran cantidad de datos y su frecuencia como un gráfico contiguo.

Instalación:

Para instalar la biblioteca altair y vega_datasets, ejecutamos el siguiente comando en nuestro símbolo del sistema.

pip install altair
pip install vega-datasets

En este artículo, vamos a trazar un histograma simple con la ayuda de la biblioteca altair mediante el uso de conjuntos de datos de automóviles e iris en los siguientes ejemplos.

Enfoque paso a paso:

  • Importar la biblioteca.
  • Cree o cargue los conjuntos de datos.
  • Seleccione la columna del conjunto de datos sobre la que queremos hacer el histograma.
  • Para hacer un histograma, en la biblioteca de altair tenemos que dar tres elementos importantes (altair.Chart(), mark_bar(), encode()).
  • Póngalo en la variable que se denomine como «hist».
  • Luego, para ver la trama, tenemos que escribir la única línea de código que es hist.show() y listo.

Sintaxis:

altair.Chart(name_of_dataset).mark_bar().encode(x =”name_of_col1″, y=”name_of_col2″)

Ejemplo 1: Imprimiendo el conjunto de datos de autos()

Python

# importing libraries
import altair as alt
from vega_datasets import data
import vega_datasets
  
# importing cars dataset form
# vega_datasets provided by altair
car_data  = data.cars()
  
# printing the dataset
display(car_data)

Producción:

Ejemplo 2: hacer el histograma simple predeterminado usando el conjunto de datos de automóviles.

Python

# importing libraries
import altair as alt
from vega_datasets import data
  
# importing cars dataset
# form vega_datasets provided by altair
car_data  = data.cars()
  
# making the simple histogram on Acceleration
hist = alt.Chart(car_data).mark_bar().encode(x = 'Acceleration',
                                             y = 'count()')
# showing the histogram
hist.show()

Producción:

Ejemplo 3: hacer el histograma simple usando el conjunto de datos de automóviles configurando el contenedor en Aceleración.

Python

# importing libraries
import altair as alt
from vega_datasets import data
  
# importing cars dataset
# form vega_datasets provided by altair
car_data  = data.cars()
  
# making the simple histogram
# on Acceleration by setting the bin
hist = alt.Chart(car_data).mark_bar().encode(x = alt.X('Acceleration',
                                                       bin = alt.BinParams(maxbins = 30)),
                                             y = 'count()')
# showing the histogram
hist.show()

Producción:

Ejemplo 4: hacer el histograma simple usando el conjunto de datos de automóviles configurando el contenedor en Caballos de fuerza.

Python

# importing libraries
import altair as alt
from vega_datasets import data
  
# importing cars dataset
# form vega_datasets provided by altair
car_data  = data.cars()
  
# making the simple histogram
# on Horsepower by setting the bin
hist = alt.Chart(car_data).mark_bar().encode(x = alt.X('Horsepower',
                                                       bin = alt.BinParams(maxbins = 20)),
                                             y = 'count()')
# showing the histogram
hist.show()

Producción:

Ejemplo 5: hacer el histograma simple predeterminado usando el conjunto de datos de iris en sepalLength.

Python

# importing libraries
import altair as alt
from vega_datasets import data
  
# importing cars dataset
# form vega_datasets provided by altair
iris_data  = data.iris()
  
# making the simple histogram on sepal length
hist = alt.Chart(iris_data).mark_bar().encode(x = 'sepalLength',
                                              y = 'count()')
  
# showing the histogram
hist.show()

Producción:

También podemos imprimir el conjunto de datos del iris usando print(iris_data) en el programa después de cargar el conjunto de datos del iris. Nuestro conjunto de datos de iris después de imprimir se ve así.

Ejemplo 6: Hacer el histograma simple configurando bin y color.

Python

# importing libraries
import altair as alt
from vega_datasets import data
  
# importing cars dataset
# form vega_datasets provided by altair
iris_data  = data.iris()
  
# making the simple histogram
# on sepal length by setting bin
# and color on the basis of species
hist = alt.Chart(iris_data).mark_bar().encode(x = alt.X('sepalLength',
                                                        bin = alt.BinParams(maxbins = 20)),
                                              y = 'count()',color = 'species')
# showing the histogram
hist.show()

Producción:

De la misma manera, podemos hacer el histograma simple en cualquier valor del conjunto de datos y podemos establecer el color en consecuencia.

Ejemplo 7: Realización de un histograma simple utilizando un conjunto de datos de iris sobre el ancho de los pétalos configurando el contenedor y el color.

Python

# importing libraries
import altair as alt
from vega_datasets import data
  
# importing cars dataset
# form vega_datasets provided by altair
iris_data  = data.iris()
  
# making the simple histogram
# on petal width by setting bin
# and color on the basis of species
hist = alt.Chart(iris_data).mark_bar().encode(x = alt.X('petalWidth',
                                                        bin = alt.BinParams(maxbins = 10)),
                                              y = 'count()', color = 'species')
# showing the histogram
hist.show()

Producción:

Publicación traducida automáticamente

Artículo escrito por srishivansh5404 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *