Visualización de datos con Chartify

Chartify es una biblioteca de visualización de datos de código abierto de Spotify que facilita a los analistas de datos la creación de tablas y gráficos. Chartify se basa en Bokeh, que es una biblioteca de visualización de datos muy popular. Este artículo ofrece una breve introducción a esta tecnología. 

Módulos necesarios

Instale la última versión de Chartify y Pandas. Para instalar estos módulos, escriba el siguiente comando en la terminal.

pip install chartify
pip install pandas

Se requiere Pandas para la limpieza y manipulación de datos en este contexto. Importémoslos a nuestro código de Python. Se recomienda utilizar el cuaderno Jupyter o Google Colab para cualquier tipo de visualización o análisis de datos.

Python3

import chartify
import pandas as pd

Chartify hace que sea muy fácil para cualquiera comenzar. El siguiente código ayuda a configurar un gráfico simple y lo muestra en el cuaderno.

Python3

ch = chartify.Chart()
ch.show()

Producción:

Sin embargo, este es solo un gráfico vacío sin datos. Intentemos llenar este gráfico con datos para ver cómo cobra vida esta herramienta de visualización. Chartify viene con sus propios ejemplos de conjuntos de datos que puede usar para aprender. Por lo tanto, vamos a cargar los datos de ejemplo y mostrarlos.

Python3

data = chartify.examples.example_data()
data.head()

datos.head()

Si analizamos este conjunto de datos, podemos llegar a la conclusión de que se trata de datos de series temporales. La hora (o la fecha), por convención, se muestra en el eje X. Por lo tanto, establezcamos el tipo del eje X en DateTime .

Python3

ch = chartify.Chart(x_axis_type='datetime')

Ahora hay varios tipos de gráficos que puede dibujar con esta herramienta. Sin embargo, en este artículo vamos a usar solo dos, es decir, diagrama de dispersión e histograma.

Primero, construyamos un diagrama de dispersión. La forma más fácil de hacerlo es usando el método de dispersión . Los argumentos que se deben pasar son data_frame que tiene los datos que se trazarán, x_column que especifica el eje X y y_column que especifica el eje Y. Todos los demás argumentos son opcionales (es decir, se les asigna un valor predeterminado cuando no se especifica). El argumento color_column colorea el gráfico de la base de la columna especificada. Digamos que en el conjunto de datos anterior configuramos color_column para que sea la columna «fruta». Chartify asigna diferentes colores a diferentes nombres de frutas en la columna. Una lista de valores dentro de color_columnEl argumento se utiliza para la clasificación específica de los colores. alfa es la transparencia (valor alfa) de un gráfico. Aquí 1.0 es completamente opaco, mientras que 0.0 es completamente transparente. marcador se refiere a la marca en la gráfica para los valores. Los marcadores pueden ser un círculo, un asterisco, un diamante, un triángulo y varias otras formas.

Sintaxis: scatter(data_frame, x_column, y_column, size_column=Ninguno, color_column=Ninguno, color_order=Ninguno, alfa=1.0, marcador=’círculo’)

Ahora configuremos el título, el subtítulo y otros atributos para nuestro gráfico.

Python3

ch.set_title("Quantity Fruit vs Date")
ch.set_subtitle("Quantity of fruits grown all around the world")
  
ch.axes.set_xaxis_label("Date")
ch.axes.set_yaxis_label("Quantity")
ch.set_source_label("Source:Chartify Examples")

Ahora hagamos un diagrama de dispersión usando lo siguiente y mostrémoslo en el cuaderno. data o el conjunto de datos de ejemplo que obtuvimos de Chartify será nuestro data_frame . El eje X será la fecha y el eje Y será la cantidad . La color_column será fruit .

Python3

ch.plot.scatter(data_frame=data, x_column='date',
                y_column='quantity', 
                color_column='fruit')
ch.show()

Producción:

Gráfico de dispersión

Por lo tanto, hemos construido un gráfico de dispersión simple. Ahora hagamos un histograma usando el mismo conjunto de datos. Tracemos un histograma que visualice la densidad de datos con respecto a la cantidad.

Python3

ch = chartify.Chart(y_axis_type='density')

Para trazar el histograma vamos a utilizar el método del histograma . Al igual que el diagrama de dispersión, incluso el histograma toma un argumento de marco de datos . color_column y color_order funcionan de la misma manera que en el diagrama de dispersión. El argumento del método toma un método y calcula la densidad del gráfico sobre esa base. El conteo es el método predeterminado. 

Sintaxis: histogram(data_frame, value_column, color_column=Ninguno, color_order=Ninguno, method=’count’, bins=’auto’)

Ahora establezcamos los atributos de nuestro gráfico.

Python3

ch.set_title("Quantity vs Count")
ch.axes.set_xaxis_label("Quantity")
ch.axes.set_yaxis_label("Count")
ch.set_source_label("Source:Chartify Examples")

Ahora tracemos el histograma usando el método mencionado anteriormente.

Python3

ch.plot.histogram(data_frame=data, values_column='quantity')
ch.show()

Producción:

Histograma

Por lo tanto, en este artículo, hemos trazado un histograma y un diagrama de dispersión utilizando Chartify de Spotify. Este es solo un artículo para principiantes y el mismo conocimiento se puede ampliar aún más para crear visualizaciones más complejas.

Publicación traducida automáticamente

Artículo escrito por rahulhegde97 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *