Requisito previo: Exploración de la distribución de datos | Conjunto 1
Términos relacionados con la exploración de la distribución de datos
-> Boxplot -> Frequency Table -> Histogram -> Density Plot
Para obtener el enlace al archivo csv utilizado, haga clic aquí .
Cargando bibliotecas
Python3
import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt
Cargando datos
Python3
data = pd.read_csv("../data/state.csv") # Adding a new column with derived data data['PopulationInMillions'] = data['Population']/1000000 print (data.head(10))
Producción :
- Histograma: es una forma de visualizar la distribución de datos a través de una tabla de frecuencia con contenedores en el eje x y conteo de datos en el eje y.
Código – Histograma
Python3
# Histogram Population In Millions fig, ax2 = plt.subplots() fig.set_size_inches(9, 15) ax2 = sns.distplot(data.PopulationInMillions, kde = False) ax2.set_ylabel("Frequency", fontsize = 15) ax2.set_xlabel("Population by State in Millions", fontsize = 15) ax2.set_title("Population - Histogram", fontsize = 20)
- Producción :
- Gráfico de densidad: está relacionado con el histograma, ya que muestra los valores de datos que se distribuyen como una línea continua. Es una versión suavizada del histograma. El siguiente resultado es el gráfico de densidad superpuesto al histograma.
Código: diagrama de densidad para los datos
Python3
# Density Plot - Population fig, ax3 = plt.subplots() fig.set_size_inches(7, 9) ax3 = sns.distplot(data.Population, kde = True) ax3.set_ylabel("Density", fontsize = 15) ax3.set_xlabel("Murder Rate per Million", fontsize = 15) ax3.set_title("Density Plot - Population", fontsize = 20)
- Producción :
Publicación traducida automáticamente
Artículo escrito por Mohit Gupta_OMG 🙂 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA