Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
DataFrame.astype()
El método se usa para convertir un objeto pandas a un tipo de d especificado. astype()
La función también proporciona la capacidad de convertir cualquier columna existente adecuada a tipo categórico.
DataFrame.astype()
La función es muy útil cuando queremos convertir un tipo de datos de columna particular en otro tipo de datos. No solo eso, sino que también podemos usar una entrada de diccionario de Python para cambiar más de un tipo de columna a la vez. La etiqueta de clave en el diccionario corresponde al nombre de la columna y la etiqueta de valores en el diccionario corresponde a los nuevos tipos de datos de los que queremos que sean las columnas.
Sintaxis: DataFrame.astype(dtype, copy=True, errors=’raise’, **kwargs)
Parámetros:
dtype: use unnumpy.dtype
tipo o Python para convertir todo el objeto pandas en el mismo tipo. Alternativamente, use {col: dtype, …}, donde col es una etiqueta de columna y dtype es unnumpy.dtype
tipo de Python para convertir una o más de las columnas de DataFrame en tipos específicos de columna.
copy: devuelve una copia cuando copy=True (tenga mucho cuidado al configurar copy=False ya que los cambios en los valores pueden propagarse a otros objetos pandas).errores: controle el aumento de excepciones en datos no válidos para el tipo de d proporcionado.
aumentar: permitir que se
generen excepciones ignorar: suprimir excepciones. En caso de error, devolver el objeto originalkwargs: argumentos de palabras clave para pasar al constructor
Devoluciones: emitido: tipo de persona que llama
Para obtener un enlace al archivo CSV utilizado en el código, haga clic aquí
Ejemplo #1: Convierta el tipo de datos de la columna Peso.
# importing pandas as pd import pandas as pd # Making data frame from the csv file df = pd.read_csv("nba.csv") # Printing the first 10 rows of # the data frame for visualization df[:10]
Como los datos tienen algunos valores «nan», para evitar cualquier error, eliminaremos todas las filas que contengan nan
valores.
# drop all those rows which # have any 'nan' value in it. df.dropna(inplace = True)
# let's find out the data type of Weight column before = type(df.Weight[0]) # Now we will convert it into 'int64' type. df.Weight = df.Weight.astype('int64') # let's find out the data type after casting after = type(df.Weight[0]) # print the value of before before # print the value of after after
Producción:
# print the data frame and see # what it looks like after the change df
Ejemplo #2: Cambiar el tipo de datos de más de una columna a la vez
Cambie la Name
columna a tipo categórico y la Age
columna a tipo int64.
# importing pandas as pd import pandas as pd # Making data frame from the csv file df = pd.read_csv("nba.csv") # Drop the rows with 'nan' values df = df.dropna() # print the existing data type of each column df.info()
Producción:
Ahora cambiemos el tipo de datos de ambas columnas a la vez.
# Passed a dictionary to astype() function df = df.astype({"Name":'category', "Age":'int64'}) # Now print the data type # of all columns after change df.info()
Producción:
# print the data frame # too after the change df
Producción:
Publicación traducida automáticamente
Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA