Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Pandas Series.clip_lower() se usa para recortar valores por debajo de un valor mínimo pasado. Se pasa un valor de umbral como parámetro y todos los valores en serie que son menores que los valores de umbral se vuelven iguales a él.
Sintaxis: Series.clip_lower(umbral, eje=Ninguno, en el lugar=Falso)
Parámetros:
umbral: numérico o similar a una lista, establece el valor de umbral mínimo y, en el caso de una lista, establece valores de umbral separados para cada valor en la serie de llamadas (el tamaño de lista dado es mismo)
eje: 0 o ‘índice’ para aplicar el método por filas y 1 o ‘columnas’ para aplicar por columnas en el
lugar: realice cambios en la serie de llamadas en sí. (Sobrescribir con nuevos valores)
Tipo de retorno: Serie con valores actualizados
Para descargar el conjunto de datos utilizado en el siguiente ejemplo, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.
Ejemplo n.º 1 : aplicación en series con un solo valor
En este ejemplo, se pasa un valor de umbral mínimo de 26 como parámetro al método .clip_lower(). Este método se llama en la columna Edad del marco de datos y los nuevos valores se almacenan en la columna Edad_nueva. Antes de realizar cualquier operación, las filas nulas se descartan usando .dropna()
Python3
# importing pandas module import pandas as pd # making data frame data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # removing null values to avoid errors data.dropna(inplace = True) # setting threshold value threshold = 26.0 # applying method and passing to new column data["Age_new"]= data["Age"].clip_lower(threshold) # display data
Salida:
como se muestra en la imagen de salida, la columna Age_new tiene un valor mínimo de 26. Todos los valores inferiores a 26 se incrementaron a 26 y se almacenaron en una nueva columna.
Ejemplo n.º 2: aplicación en series con valor de tipo de lista
En este ejemplo, las 10 filas principales de la columna Edad se extraen y almacenan mediante el método .head(). Después de eso, se crea una lista de la misma longitud y se pasa al parámetro de umbral del método .clip_lower() para establecer un valor de umbral separado para cada valor en serie. Los valores devueltos se almacenan en una nueva columna ‘valores recortados’.
Python3
# importing pandas module import pandas as pd # importing regex module import re # making data frame data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # removing null values to avoid errors data.dropna(inplace = True) # returning top rows new_data = data.head(10).copy() # list for separate threshold values threshold =[27, 23, 19, 30, 26, 22, 22, 41, 11, 33] # applying method and returning to new column new_data["Clipped values"]= new_data["Age"].clip_lower(threshold = threshold) # display new_data
Salida:
como se muestra en la imagen de salida, cada valor en serie tenía un valor de umbral diferente según la lista aprobada y, por lo tanto, los resultados se devolvieron según el valor de umbral separado de cada elemento.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA