Python | Pandas Index.duplicado()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

Función Pandas Index.duplicated()Indicar valores de índice duplicados. Los valores duplicados se indican como valores verdaderos en la array resultante. Se pueden indicar todos los duplicados, todos excepto el primero, o todos excepto la última aparición de duplicados.

Sintaxis: Index.duplicated(keep=’first’)

Parámetros:
mantener: {‘primero’, ‘último’, Falso}, predeterminado ‘primero’
El valor o valores en un conjunto de duplicados para marcar como perdidos.
-> ‘primero’: marca los duplicados como verdaderos, excepto la primera aparición.
-> ‘último’: marca los duplicados como verdaderos, excepto la última aparición.
-> Falso: marca todos los duplicados como verdaderos.

Devoluciones: numpy.ndarray

Ejemplo #1: Use Index.duplicated()la función para indicar todos los valores duplicados en el Índice excepto el primero.

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', 'Labrador', 
                      'Lhasa', 'Husky', 'Beagle'])
  
# Print the Index
idx

Producción :

Averigüemos si un valor presente en Index es un valor duplicado o único.

# Identify the duplicated values except the first
idx.duplicated(keep ='first')

Salida:

como podemos ver en la salida, la Index.duplicated()función ha marcado todas las ocurrencias de valor duplicado como Trueexcepto la primera ocurrencia.

Ejemplo #2: Use Index.duplicated()la función para identificar todos los valores duplicados. aquí todos los valores duplicados se marcarán comoTrue

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index([100, 50, 45, 100, 12, 50, None])
  
# Print the Index
idx

Producción :

Identifiquemos todos los valores duplicados en el Índice.

Nota: Estamos teniendo NaNvalores en el Índice.

# Identify all duplicated occurrence of values
idx.duplicated(keep = False)

Producción :

La función ha marcado todos los valores duplicados como verdaderos. También ha tratado la aparición única de NaNvalor como única y la ha marcado como falsa.

Publicación traducida automáticamente

Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta Cancelar la respuesta