En este artículo, veremos cómo seleccionar columnas con tipos de datos específicos de un marco de datos. Esta operación se puede realizar usando el método DataFrame.select_dtypes() en el módulo pandas .
Sintaxis: DataFrame.select_dtypes(incluir=Ninguno, excluir=Ninguno)
Parámetros:
incluir, excluir: Una selección de dtypes o strings para incluir/excluir. Se debe proporcionar al menos uno de estos parámetros.
Retorno: el subconjunto del marco que incluye los tipos de d en incluir y excluyendo los tipos de d en excluir.
Enfoque paso a paso:
- Primero, importe los módulos y luego cargue el conjunto de datos .
Python3
# import required module import pandas as pd # assign dataset df = pd.read_csv("train.csv")
- Luego encontraremos los tipos de datos presentes en nuestro conjunto de datos usando el método dataframe.info() .
Python3
# display description # of the dataset df.info()
Producción:
- Ahora, usaremos DataFrame.select_dtypes() para seleccionar un tipo de datos específico.
Python3
# store columns with specific data type integer_columns = df.select_dtypes(include=['int64']).columns float_columns = df.select_dtypes(include=['float64']).columns object_columns = df.select_dtypes(include=['object']).columns
- Finalmente, muestre la columna que tiene un tipo de datos particular.
Python3
# display columns print('\nint64 columns:\n', integer_columns) print('\nfloat64 columns:\n', float_columns) print('\nobject columns:\n', object_columns)
Producción:
A continuación se muestra el programa completo basado en el enfoque anterior:
Python3
# import required module import pandas as pd # assign dataset df = pd.read_csv("train.csv") # store columns with specific data type integer_columns = df.select_dtypes(include=['int64']).columns float_columns = df.select_dtypes(include=['float64']).columns object_columns = df.select_dtypes(include=['object']).columns # display columns print('\nint64 columns:\n',integer_columns) print('\nfloat64 columns:\n',float_columns) print('\nobject columns:\n',object_columns)
Producción:
Ejemplo:
Aquí vamos a extraer columnas del siguiente conjunto de datos:
Python3
# import required module import pandas as pd from vega_datasets import data # assign dataset df = data.seattle_weather() # display dataset df.sample(10)
Producción:
Ahora, vamos a mostrar todas las columnas que tienen float64 como tipo de datos.
Python3
# import required module import pandas as pd from vega_datasets import data # assign dataset df = data.seattle_weather() # display description # of dataset df.info() # store columns with specific data type columns = df.select_dtypes(include=['float64']).columns # display columns print('\nColumns:\n', columns)
Producción:
Publicación traducida automáticamente
Artículo escrito por incredeble y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA