Plotly es una biblioteca de Python que se utiliza para diseñar gráficos, especialmente gráficos interactivos. Puede trazar varios gráficos y cuadros como histograma, diagrama de barras, diagrama de caja, diagrama de dispersión y muchos más. Se utiliza principalmente en el análisis de datos, así como en el análisis financiero. plotly es una biblioteca de visualización interactiva.
Histograma en Plotly
Un histograma es un gráfico donde se almacenan los datos y cada uno de ellos se cuenta y representa. En términos más generales, gráficamente, un histograma es un gráfico de barras acumulado, con varias funciones de acumulación posibles. Los datos a almacenar pueden ser datos numéricos pero también datos categóricos o de fecha. Se usa comúnmente para tratar con grandes datos de conjuntos.
Sintaxis: plotly.express.histogram(data_frame=Ninguno, x=Ninguno, y=Ninguno, color=Ninguno, facet_row=Ninguno, facet_col=Ninguno, facet_col_wrap=0, hover_name=Ninguno, hover_data=Ninguno, animation_frame=Ninguno, animation_group= Ninguna, category_orders={}, etiquetas={}, color_discrete_sequence=Ninguna, color_discrete_map={}, marginal=Ninguna, opacity=Ninguna, orientación=Ninguna, barmode=’relative’, barnorm=Ninguna, histnorm=Ninguna, log_x=False , log_y=False, range_x=Ninguno, range_y=Ninguno, histfunc=Ninguno, acumulativo=Ninguno, nbins=Ninguno, title=Ninguno, plantilla=Ninguno, ancho=Ninguno, alto=Ninguno)
Parámetros:
data_frame: se debe pasar DataFrame o similar a una array para los nombres de columna
x: ya sea un nombre de una columna en data_frame, o una serie de pandas o un objeto similar a una array. Los valores de esta columna o array_like se utilizan para colocar marcas a lo largo del eje x en coordenadas cartesianas.
y: ya sea un nombre de una columna en data_frame, o una serie de pandas o un objeto similar a una array. Los valores de esta columna o array_like se utilizan para colocar marcas a lo largo del eje y en coordenadas cartesianas.
color: ya sea un nombre de una columna en data_frame, o una serie de pandas o un objeto similar a una array.
Ejemplo: uso del conjunto de datos de consejos
Python3
import plotly.express as px df = px.data.tips() fig = px.histogram(df, x="total_bill") fig.show()
Producción:
Tipo de normalización
Por defecto, el modo a través del cual se representan los contenedores es el recuento de muestras. Podemos cambiar este modo usando Plotly. Ir=t se puede hacer usando el argumento histnorm. Los diferentes valores que se pueden pasar usando este argumento son:
- porcentaje o probabilidad: la salida de histfunc para un contenedor determinado se divide por la suma de la salida de histfunc para todos los contenedores.
- densidad: La salida de histfunc para un contenedor dado se divide por el tamaño del contenedor.
- densidad de probabilidad: la salida de histfunc para un contenedor dado se normaliza de modo que corresponda a la probabilidad de que un
Ejemplo 1:
Python3
import plotly.express as px df = px.data.tips() fig = px.histogram(df, x="total_bill", histnorm='probability density') fig.show()
Producción:
Ejemplo 2:
Python3
import plotly.express as px df = px.data.tips() fig = px.histogram(df, x="total_bill", histnorm='percent') fig.show()
Producción:
Selección del número de contenedores
De forma predeterminada, el número de contenedores se elige de tal manera que este número sea comparable al número típico de muestras en un contenedor. En forma gráfica, el número, así como el rango de valores, se pueden personalizar usando el parámetro nbins.
Ejemplo:
Python3
import plotly.express as px df = px.data.tips() fig = px.histogram(df, x="total_bill", histnorm='percent', nbins = 10) fig.show()
Producción:
Valores apilados en histograma
En la gráfica, se pueden mostrar diferentes valores en una columna usando el argumento de color.
Ejemplo:
Python3
import plotly.express as px df = px.data.tips() fig = px.histogram(df, x="total_bill", color = "smoker") fig.show()
Producción:
Visualización de la distribución subyacente
En forma gráfica, usando el parámetro marginal podemos visualizar la distribución de los valores. El parámetro marginal tiene tres valores:
- alfombra
- caja
- violín
Ejemplo:
Python3
import plotly.express as px df = px.data.tips() fig = px.histogram(df, x="total_bill", marginal = 'box') fig.show()
Producción:
Publicación traducida automáticamente
Artículo escrito por nishantsundriyal98 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA