Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Pandas Series.lt()
se usa para comparar dos series y devolver un valor booleano para cada elemento respectivo.
Sintaxis: Series.lt(otro, nivel=Ninguno, valor_relleno=Ninguno, eje=0)
Parámetros:
otro: otra serie a comparar con el
nivel: int o nombre del nivel en caso de multinivel
fill_value: valor a reemplazar en lugar de NaN
eje: 0 o ‘índice’ para aplicar el método por filas y 1 o ‘columnas’ a aplicar por columnas.Tipo de retorno: serie booleana
Nota: Los resultados se devuelven sobre la base de la serie de llamadas de comparación < otras series.
Para descargar el conjunto de datos utilizado en el siguiente ejemplo, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.
Ejemplo 1:
En este ejemplo, la columna Edad y las columnas Peso se comparan mediante el método .lt(). Dado que los valores en las columnas de peso son muy grandes en comparación con la columna Edad, los valores se dividen primero por 10. Antes de comparar, las filas nulas se eliminan utilizando el método .dropna() para evitar errores.
# importing pandas module import pandas as pd # making data frame data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # removing null values to avoid errors data.dropna(inplace = True) # other series other = data["Weight"]/10 # calling method and returning to new column data["Age < Weight"]= data["Age"].lt(other) # display data
Salida:
como se muestra en la imagen de salida, la nueva columna tiene Verdadero siempre que el valor en la columna Edad sea menor que Peso/10.
Ejemplo #2: Manejo de valores NaN
En este ejemplo, se crean dos series utilizando pd.Series()
. La serie también contiene un valor nulo y, por lo tanto, se pasa 10 al parámetro fill_value para reemplazar los valores nulos por 10.
# importing pandas module import pandas as pd # importing numpy module import numpy as np # creating series 1 series1 = pd.Series([11, 21, 2, 43, 9, 27, np.nan, 110, np.nan]) # creating series 2 series2 = pd.Series([16, np.nan, 2, 23, 5, 40, np.nan, 0, 19]) # setting null replacement value na_replace = 10 # calling and storing result result = series1.lt(series2, fill_value = na_replace) # display result
Salida:
Como se puede ver en la salida, los valores de NaN fueron reemplazados por 5 y la comparación se realiza después del reemplazo y los nuevos valores se utilizan para la comparación.
0 True 1 False 2 False 3 False 4 False 5 True 6 False 7 False 8 True dtype: bool
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA