Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Pandas Series.gt() se usa para comparar dos series y devolver un valor booleano para cada elemento respectivo.
Sintaxis: Series.gt(otro, nivel=Ninguno, valor_relleno=Ninguno, eje=0)
Parámetros:
otro: otra serie que se comparará con
nivel: int o nombre del nivel en caso de multinivel
valor_relleno: Valor que se reemplazará en lugar de
Eje NaN : 0 o ‘índice’ para aplicar método por filas y 1 o ‘columnas’ para aplicar por columnas.
Tipo de retorno: serie booleana
Nota: Los resultados se devuelven sobre la base de la serie de llamadas de comparación > otras series.
Para descargar el conjunto de datos utilizado en el siguiente ejemplo, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.
Ejemplo 1:
en este ejemplo, la columna Edad y las columnas Peso se comparan mediante el método .gt(). Dado que los valores en las columnas de peso son muy grandes en comparación con la columna Edad, los valores se dividen primero por 10. Antes de comparar, las filas nulas se eliminan utilizando el método .dropna() para evitar errores.
Python3
# importing pandas module import pandas as pd # importing regex module import re # making data frame data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # removing null values to avoid errors data.dropna(inplace = True) # other series other = data["Weight"]/10 # calling method and returning to new column data["Age > Weight"]= data["Age"].gt(other)
Salida:
como se muestra en la imagen de salida, la nueva columna tiene Verdadero siempre que el valor de la columna Edad sea mayor que Peso/10.
Ejemplo 2: Manejo de valores NaN
En este ejemplo, se crean dos series usando pd.Series(). La serie también contiene un valor nulo y, por lo tanto, se pasa 5 al parámetro fill_value para reemplazar los valores nulos por 5.
Python3
# importing pandas module import pandas as pd # importing numpy module import numpy as np # creating series 1 series1 = pd.Series([24, 19, 2, 33, 49, 7, np.nan, 10, np.nan]) # creating series 2 series2 = pd.Series([16, np.nan, 2, 23, 5, 40, np.nan, 0, 9]) # setting null replacement value na_replace = 5 # calling and storing result result = series1.gt(series2, fill_value = na_replace) # display result
Salida:
como se puede ver en la salida, los valores de NaN se reemplazaron por 5 y la comparación se realiza después del reemplazo y los nuevos valores se utilizan para la comparación.
0 True 1 True 2 False 3 True 4 True 5 False 6 False 7 True 8 False dtype: bool
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA