Histograma usando Plotly en Python

Plotly es una biblioteca de Python que se utiliza para diseñar gráficos, especialmente gráficos interactivos. Puede trazar varios gráficos y cuadros como histograma, diagrama de barras, diagrama de caja, diagrama de dispersión y muchos más. Se utiliza principalmente en el análisis de datos, así como en el análisis financiero. plotly es una biblioteca de visualización interactiva. 

Histograma en Plotly

Un histograma es un gráfico donde se almacenan los datos y cada uno de ellos se cuenta y representa. En términos más generales, gráficamente, un histograma es un gráfico de barras acumulado, con varias funciones de acumulación posibles. Los datos a almacenar pueden ser datos numéricos pero también datos categóricos o de fecha. Se usa comúnmente para tratar con grandes datos de conjuntos.

Sintaxis: plotly.express.histogram(data_frame=Ninguno, x=Ninguno, y=Ninguno, color=Ninguno, facet_row=Ninguno, facet_col=Ninguno, facet_col_wrap=0, hover_name=Ninguno, hover_data=Ninguno, animation_frame=Ninguno, animation_group= Ninguna, category_orders={}, etiquetas={}, color_discrete_sequence=Ninguna, color_discrete_map={}, marginal=Ninguna, opacity=Ninguna, orientación=Ninguna, barmode=’relative’, barnorm=Ninguna, histnorm=Ninguna, log_x=False , log_y=False, range_x=Ninguno, range_y=Ninguno, histfunc=Ninguno, acumulativo=Ninguno, nbins=Ninguno, title=Ninguno, plantilla=Ninguno, ancho=Ninguno, alto=Ninguno)

Parámetros:
data_frame: se debe pasar DataFrame o similar a una array para los nombres de columna
x: ya sea un nombre de una columna en data_frame, o una serie de pandas o un objeto similar a una array. Los valores de esta columna o array_like se utilizan para colocar marcas a lo largo del eje x en coordenadas cartesianas.
y: ya sea un nombre de una columna en data_frame, o una serie de pandas o un objeto similar a una array. Los valores de esta columna o array_like se utilizan para colocar marcas a lo largo del eje y en coordenadas cartesianas.
color: ya sea un nombre de una columna en data_frame, o una serie de pandas o un objeto similar a una array.

Ejemplo: uso del conjunto de datos de consejos

Python3

import plotly.express as px
  
df = px.data.tips()
  
fig = px.histogram(df, x="total_bill")
fig.show()

Producción:

Tipo de normalización

Por defecto, el modo a través del cual se representan los contenedores es el recuento de muestras. Podemos cambiar este modo usando Plotly. Ir=t se puede hacer usando el argumento histnorm. Los diferentes valores que se pueden pasar usando este argumento son:

  • porcentaje o probabilidad: la salida de histfunc para un contenedor determinado se divide por la suma de la salida de histfunc para todos los contenedores.
  • densidad: La salida de histfunc para un contenedor dado se divide por el tamaño del contenedor.
  • densidad de probabilidad: la salida de histfunc para un contenedor dado se normaliza de modo que corresponda a la probabilidad de que un

Ejemplo 1:

Python3

import plotly.express as px
  
df = px.data.tips()
  
fig = px.histogram(df, x="total_bill",
                   histnorm='probability density')
fig.show()

Producción:

Ejemplo 2:

Python3

import plotly.express as px
  
df = px.data.tips()
  
fig = px.histogram(df, x="total_bill", histnorm='percent')
fig.show()

Producción:

Selección del número de contenedores

De forma predeterminada, el número de contenedores se elige de tal manera que este número sea comparable al número típico de muestras en un contenedor. En forma gráfica, el número, así como el rango de valores, se pueden personalizar usando el parámetro nbins.

Ejemplo:

Python3

import plotly.express as px
  
df = px.data.tips()
  
fig = px.histogram(df, x="total_bill", 
                   histnorm='percent', 
                   nbins = 10)
fig.show()

Producción:

Valores apilados en histograma

En la gráfica, se pueden mostrar diferentes valores en una columna usando el argumento de color.

Ejemplo:

Python3

import plotly.express as px
  
df = px.data.tips()
  
fig = px.histogram(df, x="total_bill", color = "smoker")
fig.show()

Producción:

Visualización de la distribución subyacente

En forma gráfica, usando el parámetro marginal podemos visualizar la distribución de los valores. El parámetro marginal tiene tres valores:

  • alfombra
  • caja
  • violín

Ejemplo:

Python3

import plotly.express as px
  
df = px.data.tips()
  
fig = px.histogram(df, x="total_bill", marginal = 'box')
fig.show()

Producción:

Publicación traducida automáticamente

Artículo escrito por nishantsundriyal98 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *