Un histograma es un gráfico que muestra la frecuencia de los valores en los intervalos de una variable métrica. Estos intervalos se denominan «contenedores» y todos tienen el mismo ancho.
Podemos crear un histograma a partir del marco de datos del panda usando la función df.hist() .
Sintaxis :
DataFrame.hist(column=Ninguno, by=Ninguno, grid=True, xlabelsize=Ninguno, xrot=Ninguno, ylabelsize=Ninguno, yrot=Ninguno, ax=Ninguno, sharex=False, sharey=False, figsize=Ninguno, layout= Ninguno, bins=10, backend=Ninguno, leyenda=Falso, **kwargs)
Ejemplo 1: Creación de un histograma básico (histograma para columnas individuales)
Usamos df.hist() y plot.show() para mostrar el histograma.
Archivo CSV utilizado: gene_expression.csv
Python3
# import libraries and packages import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # reading the CSV file df = pd.read_csv('gene_expression.csv') # displaying the DataFrame print(df) # creating a basic histogram df.hist() plt.show()
Producción:
Ejemplo 2: Creación de un histograma modificado (trazado de histograma por el grupo)
En este ejemplo, agregamos parámetros adicionales al método hist. Hemos cambiado el tamaño del higo, el número de contenedores se especifica como 15, y se proporciona un parámetro que garantiza que se creen histogramas para cada grupo de cáncer.
Python3
# import libraries and packages import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # reading the CSV file df = pd.read_csv('gene_expression.csv') # displaying the DataFrame print(df) # creating a basic histogram df.hist(by='Cancer Present', figsize=[12, 8], bins=15) plt.show()
Producción:
Publicación traducida automáticamente
Artículo escrito por isitapol2002 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA