Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Pandas astype()
es uno de los métodos más importantes. Se utiliza para cambiar el tipo de datos de una serie. Cuando el marco de datos se crea a partir de un archivo csv, las columnas se importan y el tipo de datos se establece automáticamente, lo que muchas veces no es lo que realmente debería tener. Por ejemplo, una columna de salario podría importarse como una string, pero para realizar operaciones tenemos que convertirla en flotante. astype()
se utiliza para realizar tales conversiones de tipos de datos.
Sintaxis: DataFrame.astype(dtype, copy=True, errors=’raise’)
Parámetros:
dtype: Tipo de dato en el que convertir la serie. (por ejemplo, str, float, int)
copy: Hace una copia del dataframe /series.
errores: Error al generar la conversión a un tipo de datos no válido. Por ejemplo, dict to string. ‘raise’ generará el error e ‘ignore’ pasará sin generar el error.Tipo de retorno: Serie con tipos de datos modificados
Para descargar el conjunto de datos utilizado en el siguiente ejemplo, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.
Ejemplo:
En este ejemplo, el marco de datos se importa y se llama .dtypes en el marco de datos para ver los tipos de datos de la serie. Después de eso, algunas columnas se convierten usando el método .astype() y los dtypes se vuelven a ver para ver los cambios.
# importing pandas module import pandas as pd # reading csv file from url data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # dropping null value columns to avoid errors data.dropna(inplace = True) # storing dtype before converting before = data.dtypes # converting dtypes using astype data["Salary"]= data["Salary"].astype(int) data["Number"]= data["Number"].astype(str) # storing dtype after converting after = data.dtypes # printing to compare print("BEFORE CONVERSION\n", before, "\n") print("AFTER CONVERSION\n", after, "\n")
Salida:
como se muestra en la imagen de salida, los tipos de datos de las columnas se convirtieron en consecuencia.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA