Exploración con Binning Hexagonal y Gráficos de Contorno

El agrupamiento hexagonal es un gráfico de dos variables numéricas con los registros agrupados en hexágonos. El siguiente código es un diagrama de agrupamiento hexagonal de la relación entre los pies cuadrados terminados y el valor de tasación fiscal de las viviendas. En lugar de trazar puntos, los registros se agrupan en contenedores hexagonales y el color indica el número de registros en ese contenedor. Para obtener el archivo csv utilizado, haga clic aquí . Cargando bibliotecas 

Python3

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

Cargando datos 

Python3

data = pd.read_csv("kc_tax.csv")
 
print (data.head())

Producción: 

   TaxAssessedValue  SqFtTotLiving  ZipCode
0               NaN           1730  98117.0
1          206000.0           1870  98002.0
2          303000.0           1530  98166.0
3          361000.0           2000  98108.0
4          459000.0           3150  98108.0

información de datos 

Python3

print (data.shape)
print ("\n", data.info())

Producción: 

(498249, 3)


RangeIndex: 498249 entries, 0 to 498248
Data columns (total 3 columns):
TaxAssessedValue    497511 non-null float64
SqFtTotLiving       498249 non-null int64
ZipCode             467900 non-null float64
dtypes: float64(2), int64(1)
memory usage: 11.4 MB

Seleccionando datos 

Python3

# Take a subset of the King County, Washington
# Tax data, for Assessed Value for Tax purposes
# < $600, 000 and Total Living Sq. Feet > 100 &
# < 2000
 
data = data.loc[(data['TaxAssessedValue'] < 600000) &
                (data['SqFtTotLiving'] > 100) &
                (data['SqFtTotLiving'] < 2000)]

Comprobación de valor nulo 

Python3

# As you can see in the info
# that records are not complete
data['TaxAssessedValue'].isnull().values.any()

Producción: 

False

  Código n.º 1: agrupamiento hexagonal 

Python3

x = data['SqFtTotLiving']
y = data['TaxAssessedValue']
 
fig = sns.jointplot(x, y, kind ="hex",
                    color ="# 4CB391")
 
fig.fig.subplots_adjust(top = 0.85)
 
fig.set_axis_labels('Total Sq.Ft of Living Space',
                    'Assessed Value for Tax Purposes')
 
fig.fig.suptitle('Tax Assessed vs. Total Living Space',
                 size = 18);

Salida: Gráfico de contorno: Un gráfico de contorno es una curva a lo largo de la cual la función de dos variables tiene un valor constante. Es una sección plana del gráfico tridimensional de la función f(x, y) paralela al plano x, y. Una línea de contorno une puntos de igual elevación (altura) por encima de un nivel dado. Un mapa de contorno es un mapa que se ilustra en el siguiente código. El intervalo de contorno de un mapa de contorno es la diferencia de elevación entre líneas de contorno sucesivas. Código #2: Gráfico de contorno 

Python3

fig2 = sns.kdeplot(x, y, legend = True)
 
plt.xlabel('Total Sq.Ft of Space')
 
plt.ylabel('Assessed Value for Taxes')
 
fig2.figure.suptitle('Tax Assessed vs. Total Living', size = 16);

Producción:

Publicación traducida automáticamente

Artículo escrito por Mohit Gupta_OMG 🙂 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *