Python | Marco de datos de pandas.clip()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

Pandas dataframe.clip()se utiliza para recortar valores en el umbral de entrada especificado. Podemos usar esta función para poner un límite inferior y un límite superior a los valores que cualquier celda puede tener en el marco de datos.

Sintaxis: DataFrame.clip(inferior=Ninguno, superior=Ninguno, eje=Ninguno, inplace=False, *args, **kwargs)

Parámetros:
inferior: Valor umbral mínimo. Todos los valores por debajo de este umbral se establecerán en él.
superior : Valor de umbral máximo. Todos los valores por encima de este umbral se establecerán en él.
eje : Alinee el objeto con inferior y superior a lo largo del eje dado.
inplace : si realizar la operación en el lugar en los datos.
*args, **kwargs: las palabras clave adicionales no tienen efecto, pero pueden aceptarse por compatibilidad con numpy.

Ejemplo n.º 1: use clip()la función para recortar los valores de un marco de datos por debajo y por encima de un valor de umbral dado.

# importing pandas as pd
import pandas as pd
  
# Creating a dataframe using dictionary
df = pd.DataFrame({"A":[-5, 8, 12, -9, 5, 3],
                   "B":[-1, -4, 6, 4, 11, 3],
                   "C":[11, 4, -8, 7, 3, -2]})
  
# Printing the data frame for visualization
df

Ahora recorte todos los valores por debajo de -4 a -4 y todos los valores por encima de 9 a 9. Los valores entre -4 y 9 siguen siendo los mismos.

# Clip in range (-4, 9)
df.clip(-4, 9)

Producción :

Tenga en cuenta que no hay ningún valor en el marco de datos mayor que 9 ni menor que -4
 
Ejemplo n.º 2: Use clip()la función para recortar utilizando umbrales inferiores y superiores específicos por elemento de columna en el marco de datos.

# importing pandas as pd
import pandas as pd
  
# Creating a dataframe using dictionary
  
df = pd.DataFrame({"A":[-5, 8, 12, -9, 5, 3],
                   "B":[-1, -4, 6, 4, 11, 3],
                   "C":[11, 4, -8, 7, 3, -2]})
  
# Printing the dataframe
df

when axis=0, el valor se recortará en las filas. Vamos a proporcionar un umbral superior e inferior para todos los elementos de la columna (es decir, equivalente al número de filas)

Creación de una Serie para almacenar el valor de umbral inferior y superior para cada elemento de columna.

# lower limit for each individual column element.
lower_limit = pd.Series([1, -3, 2, 3, -2, -1])
  
# upper limit for each individual column element.
upper_limit = lower_limit + 5
  
# Print lower_limit
lower_limit
  
# Print upper_limit
upper_limit

Producción :


Ahora queremos aplicar estos límites en el marco de datos.

# applying different limit value for each column element
df.clip(lower_limit, upper_limit, axis = 0)

Producción :

Publicación traducida automáticamente

Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *