Python – Visualización de datos usando Bokeh

Bokeh es una biblioteca de visualización de datos en Python que proporciona gráficos y diagramas interactivos de alto rendimiento. La salida de Bokeh se puede obtener en varios medios como cuaderno, html y servidor. Es posible incrustar diagramas de bokeh en Django y aplicaciones de matraz.

Bokeh proporciona dos interfaces de visualización a los usuarios:

bokeh.models : una interfaz de bajo nivel que proporciona una gran flexibilidad a los desarrolladores de aplicaciones.
bokeh.plotting : una interfaz de alto nivel para crear glifos visuales.

Para instalar el paquete bokeh, ejecute el siguiente comando en la terminal:

pip install bokeh

El conjunto de datos utilizado para generar gráficos bokeh se recopila de Kaggle .

Código #1: Marcadores de dispersión
Para crear marcadores de círculo de dispersión, se usa el método circle().

# import modules
from bokeh.plotting import figure, output_notebook, show
  
# output to notebook
output_notebook()
  
# create figure
p = figure(plot_width = 400, plot_height = 400)
  
# add a circle renderer with
# size, color and alpha
p.circle([1, 2, 3, 4, 5], [4, 7, 1, 6, 3], 
         size = 10, color = "navy", alpha = 0.5)
  
# show the results
show(p) 

Producción :

Código #2: Línea única
Para crear una línea única, se utiliza el método line().

# import modules
from bokeh.plotting import figure, output_notebook, show
  
# output to notebook
output_notebook()
  
# create figure
p = figure(plot_width = 400, plot_height = 400)
   
# add a line renderer
p.line([1, 2, 3, 4, 5], [3, 1, 2, 6, 5], 
        line_width = 2, color = "green")
  
# show the results
show(p)

Producción :

Código #3: Gráfico de
barras El gráfico de barras presenta datos categóricos con barras rectangulares. La longitud de la barra es proporcional a los valores que se representan.

# import necessary modules
import pandas as pd
from bokeh.charts import Bar, output_notebook, show
  
# output to notebook
output_notebook()
  
# read data in dataframe
df = pd.read_csv(r"D:/kaggle/mcdonald/menu.csv")
  
# create bar
p = Bar(df, "Category", values = "Calories",
        title = "Total Calories by Category", 
                        legend = "top_right")
  
# show the results
show(p)

Producción :

Código #4: Diagrama de
caja El diagrama de caja se usa para representar datos estadísticos en una gráfica. Ayuda a resumir las propiedades estadísticas de varios grupos de datos presentes en los datos.

# import necessary modules
from bokeh.charts import BoxPlot, output_notebook, show
import pandas as pd
  
# output to notebook
output_notebook()
  
# read data in dataframe
df = pd.read_csv(r"D:/kaggle / mcdonald / menu.csv")
  
# create bar
p = BoxPlot(df, values = "Protein", label = "Category", 
            color = "yellow", title = "Protein Summary (grouped by category)",
             legend = "top_right")
  
# show the results
show(p)

Producción :

Código #5: Histograma
El histograma se usa para representar la distribución de datos numéricos. La altura de un rectángulo en un histograma es proporcional a la frecuencia de valores en un intervalo de clase.

# import necessary modules
from bokeh.charts import Histogram, output_notebook, show
import pandas as pd
  
# output to notebook
output_notebook()
  
# read data in dataframe
df = pd.read_csv(r"D:/kaggle / mcdonald / menu.csv")
  
# create histogram
p = Histogram(df, values = "Total Fat",
               title = "Total Fat Distribution", 
               color = "navy")
  
# show the results
show(p) 

Producción :

Código #6: Diagrama de dispersión El diagrama de
dispersión se usa para representar los valores de dos variables en un conjunto de datos. Ayuda a encontrar la correlación entre las dos variables que se seleccionan.

# import necessary modules
from bokeh.charts import Scatter, output_notebook, show
import pandas as pd
  
# output to notebook
output_notebook()
  
# read data in dataframe
df = pd.read_csv(r"D:/kaggle / mcdonald / menu.csv")
  
# create scatter plot
p = Scatter(df, x = "Carbohydrates", y = "Saturated Fat",
            title = "Saturated Fat vs Carbohydrates",
            xlabel = "Carbohydrates", ylabel = "Saturated Fat",
            color = "orange")
   
# show the results
show(p) 

Salida:

Referencias: https://bokeh.pydata.org/en/latest/

Publicación traducida automáticamente

Artículo escrito por SumedhKadam y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *