Python | Serie Pandas.gt()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Pandas Series.gt() se usa para comparar dos series y devolver un valor booleano para cada elemento respectivo. 
 

Sintaxis: Series.gt(otro, nivel=Ninguno, valor_relleno=Ninguno, eje=0)
Parámetros: 
otro: otra serie que se comparará con 
nivel: int o nombre del nivel en caso de multinivel 
valor_relleno: Valor que se reemplazará en lugar de
Eje NaN  : 0 o ‘índice’ para aplicar método por filas y 1 o ‘columnas’ para aplicar por columnas.
Tipo de retorno: serie booleana 
 

Nota: Los resultados se devuelven sobre la base de la serie de llamadas de comparación > otras series.
Para descargar el conjunto de datos utilizado en el siguiente ejemplo, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.
 

Ejemplo 1: 
en este ejemplo, la columna Edad y las columnas Peso se comparan mediante el método .gt(). Dado que los valores en las columnas de peso son muy grandes en comparación con la columna Edad, los valores se dividen primero por 10. Antes de comparar, las filas nulas se eliminan utilizando el método .dropna() para evitar errores.
 

Python3

# importing pandas module
import pandas as pd
 
# importing regex module
import re
   
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
   
# removing null values to avoid errors
data.dropna(inplace = True)
 
# other series
other = data["Weight"]/10
 
# calling method and returning to new column
data["Age > Weight"]= data["Age"].gt(other)

Salida: 
como se muestra en la imagen de salida, la nueva columna tiene Verdadero siempre que el valor de la columna Edad sea mayor que Peso/10. 
 

  
Ejemplo 2: Manejo de valores NaN
En este ejemplo, se crean dos series usando pd.Series(). La serie también contiene un valor nulo y, por lo tanto, se pasa 5 al parámetro fill_value para reemplazar los valores nulos por 5. 
 

Python3

# importing pandas module
import pandas as pd
 
# importing numpy module
import numpy as np
 
# creating series 1
series1 = pd.Series([24, 19, 2, 33, 49, 7, np.nan, 10, np.nan])
 
# creating series 2
series2 = pd.Series([16, np.nan, 2, 23, 5, 40, np.nan, 0, 9])
 
# setting null replacement value
na_replace = 5
 
# calling and storing result
result = series1.gt(series2, fill_value = na_replace)
 
# display
result

Salida: 
como se puede ver en la salida, los valores de NaN se reemplazaron por 5 y la comparación se realiza después del reemplazo y los nuevos valores se utilizan para la comparación.
 

0     True
1     True
2    False
3     True
4     True
5    False
6    False
7     True
8    False
dtype: bool

Publicación traducida automáticamente

Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *