Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Lo más importante en el análisis de datos es comparar valores y seleccionar los datos en consecuencia. El operador “==” también funciona para múltiples valores en un marco de datos de Pandas. Los siguientes dos ejemplos mostrarán cómo comparar y seleccionar datos de un marco de datos de Pandas.
Para descargar el archivo CSV utilizado, haga clic aquí.
Ejemplo #1: Comparación de datos
En el siguiente ejemplo, se crea un marco de datos a partir de un archivo csv. En la columna Género, solo hay 3 tipos de valores («Masculino», «Femenino» o NaN). Cada fila de la columna Sexo se compara con «Hombre» y se devuelve una serie booleana después de eso.
# importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("employees.csv") # storing boolean series in new new = data["Gender"] == "Male" # inserting new series in data frame data["New"]= new # display data
Salida:
como se muestra en la imagen de salida, para Género = «Masculino», el valor en Nueva columna es Verdadero y para los valores «Femenino» y NaN es Falso.
Example #2: Selecting Data
In the following example, the boolean series is passed to the data and only Rows having Gender=”Male” are returned.
# importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("employees.csv") # storing boolean series in new new = data["Gender"] != "Female" # inserting new series in data frame data["New"]= new # display data[new] # OR # data[data["Gender"]=="Male"] # Both are the same
Salida:
como se muestra en la imagen de salida, se devuelve el marco de datos que tiene Género = «Masculino».
Nota: Para los valores de NaN, el valor booleano es Falso.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA