El agrupamiento hexagonal es un gráfico de dos variables numéricas con los registros agrupados en hexágonos. El siguiente código es un diagrama de agrupamiento hexagonal de la relación entre los pies cuadrados terminados y el valor de tasación fiscal de las viviendas. En lugar de trazar puntos, los registros se agrupan en contenedores hexagonales y el color indica el número de registros en ese contenedor. Para obtener el archivo csv utilizado, haga clic aquí . Cargando bibliotecas
Python3
import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt
Cargando datos
Python3
data = pd.read_csv("kc_tax.csv") print (data.head())
Producción:
TaxAssessedValue SqFtTotLiving ZipCode 0 NaN 1730 98117.0 1 206000.0 1870 98002.0 2 303000.0 1530 98166.0 3 361000.0 2000 98108.0 4 459000.0 3150 98108.0
información de datos
Python3
print (data.shape) print ("\n", data.info())
Producción:
(498249, 3) RangeIndex: 498249 entries, 0 to 498248 Data columns (total 3 columns): TaxAssessedValue 497511 non-null float64 SqFtTotLiving 498249 non-null int64 ZipCode 467900 non-null float64 dtypes: float64(2), int64(1) memory usage: 11.4 MB
Seleccionando datos
Python3
# Take a subset of the King County, Washington # Tax data, for Assessed Value for Tax purposes # < $600, 000 and Total Living Sq. Feet > 100 & # < 2000 data = data.loc[(data['TaxAssessedValue'] < 600000) & (data['SqFtTotLiving'] > 100) & (data['SqFtTotLiving'] < 2000)]
Comprobación de valor nulo
Python3
# As you can see in the info # that records are not complete data['TaxAssessedValue'].isnull().values.any()
Producción:
False
Código n.º 1: agrupamiento hexagonal
Python3
x = data['SqFtTotLiving'] y = data['TaxAssessedValue'] fig = sns.jointplot(x, y, kind ="hex", color ="# 4CB391") fig.fig.subplots_adjust(top = 0.85) fig.set_axis_labels('Total Sq.Ft of Living Space', 'Assessed Value for Tax Purposes') fig.fig.suptitle('Tax Assessed vs. Total Living Space', size = 18);
Salida: Gráfico de contorno: Un gráfico de contorno es una curva a lo largo de la cual la función de dos variables tiene un valor constante. Es una sección plana del gráfico tridimensional de la función f(x, y) paralela al plano x, y. Una línea de contorno une puntos de igual elevación (altura) por encima de un nivel dado. Un mapa de contorno es un mapa que se ilustra en el siguiente código. El intervalo de contorno de un mapa de contorno es la diferencia de elevación entre líneas de contorno sucesivas. Código #2: Gráfico de contorno
Python3
fig2 = sns.kdeplot(x, y, legend = True) plt.xlabel('Total Sq.Ft of Space') plt.ylabel('Assessed Value for Taxes') fig2.figure.suptitle('Tax Assessed vs. Total Living', size = 16);
Producción:
Publicación traducida automáticamente
Artículo escrito por Mohit Gupta_OMG 🙂 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA