Seleccionar columnas con tipos de datos específicos en Pandas Dataframe

En este artículo, veremos cómo seleccionar columnas con tipos de datos específicos de un marco de datos. Esta operación se puede realizar usando el método DataFrame.select_dtypes() en el módulo pandas .

Sintaxis: DataFrame.select_dtypes(incluir=Ninguno, excluir=Ninguno)
Parámetros: 
incluir, excluir: Una selección de dtypes o strings para incluir/excluir. Se debe proporcionar al menos uno de estos parámetros.
Retorno: el subconjunto del marco que incluye los tipos de d en incluir y excluyendo los tipos de d en excluir.

Enfoque paso a paso:

  • Primero, importe los módulos y luego cargue el conjunto de datos .

Python3

# import required module
import pandas as pd
  
# assign dataset
df = pd.read_csv("train.csv")
  • Luego encontraremos los tipos de datos presentes en nuestro conjunto de datos usando el método dataframe.info() .

Python3

# display description
# of the dataset
df.info()

Producción:

  • Ahora, usaremos DataFrame.select_dtypes() para seleccionar un tipo de datos específico.

Python3

# store columns with specific data type
integer_columns = df.select_dtypes(include=['int64']).columns
float_columns = df.select_dtypes(include=['float64']).columns
object_columns = df.select_dtypes(include=['object']).columns
  • Finalmente, muestre la columna que tiene un tipo de datos particular.

Python3

# display columns
print('\nint64 columns:\n', integer_columns)
print('\nfloat64 columns:\n', float_columns)
print('\nobject columns:\n', object_columns)

Producción:

A continuación se muestra el programa completo basado en el enfoque anterior:

Python3

# import required module
import pandas as pd
  
# assign dataset
df = pd.read_csv("train.csv")
  
# store columns with specific data type
integer_columns = df.select_dtypes(include=['int64']).columns
float_columns = df.select_dtypes(include=['float64']).columns
object_columns = df.select_dtypes(include=['object']).columns
  
# display columns
print('\nint64 columns:\n',integer_columns)
print('\nfloat64 columns:\n',float_columns)
print('\nobject columns:\n',object_columns)

Producción:

Ejemplo:

Aquí vamos a extraer columnas del siguiente conjunto de datos:

Python3

# import required module
import pandas as pd
from vega_datasets import data
  
# assign dataset
df = data.seattle_weather()
  
# display dataset
df.sample(10)

Producción:

Ahora, vamos a mostrar todas las columnas que tienen float64 como tipo de datos.

Python3

# import required module
import pandas as pd
from vega_datasets import data
  
# assign dataset
df = data.seattle_weather()
  
# display description
# of dataset
df.info()
  
# store columns with specific data type
columns = df.select_dtypes(include=['float64']).columns
  
# display columns
print('\nColumns:\n', columns)

Producción:

Publicación traducida automáticamente

Artículo escrito por incredeble y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *