Python | Pandas DataFrame.astype()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

DataFrame.astype()El método se usa para convertir un objeto pandas a un tipo de d especificado. astype()La función también proporciona la capacidad de convertir cualquier columna existente adecuada a tipo categórico.

DataFrame.astype()La función es muy útil cuando queremos convertir un tipo de datos de columna particular en otro tipo de datos. No solo eso, sino que también podemos usar una entrada de diccionario de Python para cambiar más de un tipo de columna a la vez. La etiqueta de clave en el diccionario corresponde al nombre de la columna y la etiqueta de valores en el diccionario corresponde a los nuevos tipos de datos de los que queremos que sean las columnas.

Sintaxis: DataFrame.astype(dtype, copy=True, errors=’raise’, **kwargs)

Parámetros:
dtype: use un numpy.dtype tipo o Python para convertir todo el objeto pandas en el mismo tipo. Alternativamente, use {col: dtype, …}, donde col es una etiqueta de columna y dtype es un numpy.dtypetipo de Python para convertir una o más de las columnas de DataFrame en tipos específicos de columna.
copy: devuelve una copia cuando copy=True (tenga mucho cuidado al configurar copy=False ya que los cambios en los valores pueden propagarse a otros objetos pandas).

errores: controle el aumento de excepciones en datos no válidos para el tipo de d proporcionado.
aumentar: permitir que se
generen excepciones ignorar: suprimir excepciones. En caso de error, devolver el objeto original

kwargs: argumentos de palabras clave para pasar al constructor

Devoluciones: emitido: tipo de persona que llama

Para obtener un enlace al archivo CSV utilizado en el código, haga clic aquí

Ejemplo #1: Convierta el tipo de datos de la columna Peso.

# importing pandas as pd
import pandas as pd
  
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
  
# Printing the first 10 rows of 
# the data frame for visualization
  
df[:10]

Como los datos tienen algunos valores «nan», para evitar cualquier error, eliminaremos todas las filas que contengan nan valores.

# drop all those rows which 
# have any 'nan' value in it.
df.dropna(inplace = True)

# let's find out the data type of Weight column
before = type(df.Weight[0])
  
# Now we will convert it into 'int64' type.
df.Weight = df.Weight.astype('int64')
  
# let's find out the data type after casting
after = type(df.Weight[0])
  
# print the value of before
before
  
# print the value of after
after

Producción:

# print the data frame and see
# what it looks like after the change
df

Ejemplo #2: Cambiar el tipo de datos de más de una columna a la vez

Cambie la Name columna a tipo categórico y la Age columna a tipo int64.

# importing pandas as pd
import pandas as pd
  
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
  
# Drop the rows with 'nan' values
df = df.dropna()
  
# print the existing data type of each column
df.info()

Producción:

Ahora cambiemos el tipo de datos de ambas columnas a la vez.

# Passed a dictionary to astype() function 
df = df.astype({"Name":'category', "Age":'int64'})
  
# Now print the data type 
# of all columns after change
df.info()

Producción:

# print the data frame
# too after the change
df

Producción:

Publicación traducida automáticamente

Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *