¿Cómo verificar el tipo de datos en Pandas DataFrame?

Pandas DataFrame es una estructura de datos bidimensional de tamaño mutable y datos tabulares heterogéneos. Hay diferentes tipos de datos integrados disponibles en Python. Dos métodos utilizados para comprobar los tipos de datos son pandas.DataFrame.dtypes y pandas.DataFrame.select_dtypes.

Considere un conjunto de datos de una tienda de compras que tenga datos sobre el número de serie del cliente, el nombre del cliente, la identificación del producto del artículo comprado, el costo del producto y la fecha de compra.

Python3

#importing pandas as pd
import pandas as pd
 
# Create the dataframe
df = pd.DataFrame({
'Cust_No': [1,2,3],
'Cust_Name': ['Alex', 'Bob', 'Sophie'],
'Product_id': [12458,48484,11311],
'Product_cost': [65.25, 25.95, 100.99],
'Purchase_Date': [pd.Timestamp('20180917'),
                  pd.Timestamp('20190910'),
                  pd.Timestamp('20200610')]
})
 
# Print the dataframe
df

Producción: 

Método 1: Usar pandas.DataFrame.dtypes 

Para que los usuarios verifiquen el tipo de datos de un conjunto de datos en particular o una columna en particular del conjunto de datos, pueden usar este método. Este método devuelve una lista de tipos de datos para cada columna o también devuelve solo un tipo de datos de una columna en particular

Ejemplo 1 : 

Python3

# Print a list datatypes of all columns
 
df.dtypes

Producción:

Ejemplo 2: 

Python3

# print datatype of particular column
df.Cust_No.dtypes

Producción: 

dtype('int64')

Método 2: Usar pandas.DataFrame.select_dtypes 

A diferencia de verificar el tipo de datos, el usuario puede realizar una verificación alternativa para obtener los datos de un tipo de datos en particular si existe; de ​​lo contrario, obtendrá un conjunto de datos vacío a cambio. Este método devuelve un subconjunto de las columnas de DataFrame según los tipos de columna.

Ejemplo 1:

Python3

# Returns Two column of int64
df.select_dtypes(include = 'int64')

Producción: 

python-padnas

Ejemplo 2: 

Python3

# Returns columns excluding int64
df.select_dtypes(exclude = 'int64')

Producción : 

Ejemplo 3: 

Python3

# Print an empty list as there is
# no column of bool type
df.select_dtypes(include = "bool")

Producción : 

Publicación traducida automáticamente

Artículo escrito por abhishekkharmale y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *