Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Pandas dataframe.clip()
se utiliza para recortar valores en el umbral de entrada especificado. Podemos usar esta función para poner un límite inferior y un límite superior a los valores que cualquier celda puede tener en el marco de datos.
Sintaxis: DataFrame.clip(inferior=Ninguno, superior=Ninguno, eje=Ninguno, inplace=False, *args, **kwargs)
Parámetros:
inferior: Valor umbral mínimo. Todos los valores por debajo de este umbral se establecerán en él.
superior : Valor de umbral máximo. Todos los valores por encima de este umbral se establecerán en él.
eje : Alinee el objeto con inferior y superior a lo largo del eje dado.
inplace : si realizar la operación en el lugar en los datos.
*args, **kwargs: las palabras clave adicionales no tienen efecto, pero pueden aceptarse por compatibilidad con numpy.
Ejemplo n.º 1: use clip()
la función para recortar los valores de un marco de datos por debajo y por encima de un valor de umbral dado.
# importing pandas as pd import pandas as pd # Creating a dataframe using dictionary df = pd.DataFrame({"A":[-5, 8, 12, -9, 5, 3], "B":[-1, -4, 6, 4, 11, 3], "C":[11, 4, -8, 7, 3, -2]}) # Printing the data frame for visualization df
Ahora recorte todos los valores por debajo de -4 a -4 y todos los valores por encima de 9 a 9. Los valores entre -4 y 9 siguen siendo los mismos.
# Clip in range (-4, 9) df.clip(-4, 9)
Producción :
Tenga en cuenta que no hay ningún valor en el marco de datos mayor que 9 ni menor que -4
Ejemplo n.º 2: Use clip()
la función para recortar utilizando umbrales inferiores y superiores específicos por elemento de columna en el marco de datos.
# importing pandas as pd import pandas as pd # Creating a dataframe using dictionary df = pd.DataFrame({"A":[-5, 8, 12, -9, 5, 3], "B":[-1, -4, 6, 4, 11, 3], "C":[11, 4, -8, 7, 3, -2]}) # Printing the dataframe df
when axis=0
, el valor se recortará en las filas. Vamos a proporcionar un umbral superior e inferior para todos los elementos de la columna (es decir, equivalente al número de filas)
Creación de una Serie para almacenar el valor de umbral inferior y superior para cada elemento de columna.
# lower limit for each individual column element. lower_limit = pd.Series([1, -3, 2, 3, -2, -1]) # upper limit for each individual column element. upper_limit = lower_limit + 5 # Print lower_limit lower_limit # Print upper_limit upper_limit
Producción :
Ahora queremos aplicar estos límites en el marco de datos.
# applying different limit value for each column element df.clip(lower_limit, upper_limit, axis = 0)
Producción :
Publicación traducida automáticamente
Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA