Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Función Pandas Index.duplicated()
Indicar valores de índice duplicados. Los valores duplicados se indican como valores verdaderos en la array resultante. Se pueden indicar todos los duplicados, todos excepto el primero, o todos excepto la última aparición de duplicados.
Sintaxis: Index.duplicated(keep=’first’)
Parámetros:
mantener: {‘primero’, ‘último’, Falso}, predeterminado ‘primero’
El valor o valores en un conjunto de duplicados para marcar como perdidos.
-> ‘primero’: marca los duplicados como verdaderos, excepto la primera aparición.
-> ‘último’: marca los duplicados como verdaderos, excepto la última aparición.
-> Falso: marca todos los duplicados como verdaderos.Devoluciones: numpy.ndarray
Ejemplo #1: Use Index.duplicated()
la función para indicar todos los valores duplicados en el Índice excepto el primero.
# importing pandas as pd import pandas as pd # Creating the Index idx = pd.Index(['Labrador', 'Beagle', 'Labrador', 'Lhasa', 'Husky', 'Beagle']) # Print the Index idx
Producción :
Averigüemos si un valor presente en Index es un valor duplicado o único.
# Identify the duplicated values except the first idx.duplicated(keep ='first')
Salida:
como podemos ver en la salida, la Index.duplicated()
función ha marcado todas las ocurrencias de valor duplicado como True
excepto la primera ocurrencia.
Ejemplo #2: Use Index.duplicated()
la función para identificar todos los valores duplicados. aquí todos los valores duplicados se marcarán comoTrue
# importing pandas as pd import pandas as pd # Creating the Index idx = pd.Index([100, 50, 45, 100, 12, 50, None]) # Print the Index idx
Producción :
Identifiquemos todos los valores duplicados en el Índice.
Nota: Estamos teniendo NaN
valores en el Índice.
# Identify all duplicated occurrence of values idx.duplicated(keep = False)
Producción :
La función ha marcado todos los valores duplicados como verdaderos. También ha tratado la aparición única de NaN
valor como única y la ha marcado como falsa.
Publicación traducida automáticamente
Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA