Python | Serie Pandas.clip_upper()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

Pandas Series.clip_upper()se utiliza para recortar valores por encima de un valor máximo pasado. Se pasa un valor de umbral como parámetro y todos los valores en serie que son mayores que los valores de umbral se vuelven iguales a él.

Sintaxis: Series.clip_upper(umbral, eje=Ninguno, en el lugar=Falso)

Parámetros:
umbral: numérico o similar a una lista, establece el valor de umbral máximo y, en el caso de una lista, establece valores de umbral separados para cada valor en la serie de llamadas (dado que el tamaño de la lista es el mismo)
eje: 0 o ‘índice’ para aplicar el método por filas y 1 o ‘columnas’ para aplicar por columnas.
inplace: Realice cambios en la propia serie de llamadas. (Sobrescribir con nuevos valores)

Tipo de retorno: Serie con valores actualizados

Para descargar el conjunto de datos utilizado en el siguiente ejemplo, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.

Ejemplo n.° 1 : Aplicar en series con un solo valor
En este ejemplo, se pasa un valor de umbral máximo de 26 como parámetro al método .clip_upper(). Este método se llama en la columna Edad del marco de datos y los nuevos valores se almacenan en la columna Edad_nueva. Antes de realizar cualquier operación, las filas nulas se descartan usando .dropna()

Python3

# importing pandas module 
import pandas as pd 
  
# making data frame 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 
    
# removing null values to avoid errors 
data.dropna(inplace = True) 
  
# setting threshold value
threshold = 26.0
  
# applying method and passing to new column
data["Age_new"]= data["Age"].clip_upper(threshold)
  
# displaying top 10 rows
data.head(10)

Salida:
como se muestra en la imagen de salida, la columna Age_new tiene un valor máximo de 26. Todos los valores superiores a 26 se recortaron y se igualaron a 26.

 
Ejemplo n.º 2: aplicación en series con valor de tipo lista

En este ejemplo, las 10 primeras filas de la columna Edad se extraen y almacenan mediante el .head() método. Después de eso, se crea una lista de la misma longitud y se pasa al parámetro de umbral del .clip_upper() método para establecer un valor de umbral separado para cada valor en serie. Los valores devueltos se almacenan en una nueva columna ‘valores recortados’.

Python3

# importing pandas module 
import pandas as pd 
  
# importing regex module
import re
    
# making data frame 
data = pd.read_csv("https://media.geeksforgeeks.org /wp-content/uploads/nba.csv") 
    
# removing null values to avoid errors 
data.dropna(inplace = True) 
  
# returning top rows
new_data = data.head(10).copy()
  
# list for separate threshold values
threshold =[27, 23, 19, 30, 26, 22, 22, 41, 11, 33]
  
# applying method and returning to new column
new_data["Clipped values"]= new_data["Age"].clip_upper(threshold = threshold)
  
# display
new_data

Salida:
como se muestra en la imagen de salida, cada valor en serie tenía un valor de umbral diferente según la lista aprobada y, por lo tanto, los resultados se devolvieron según el valor de umbral separado de cada elemento. Todos los valores superiores a sus respectivos valores de umbral se recortaron hasta el valor de umbral.

Publicación traducida automáticamente

Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *