Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Mientras analiza los datos, muchas veces el usuario quiere ver los valores únicos en una columna en particular. Pandas nunique()
se utiliza para obtener un recuento de valores únicos.
Para descargar el archivo CSV utilizado, haga clic aquí .
Sintaxis: Series.nunique(dropna=True)
Parámetros:
dropna: Excluir valor NULL si es VerdaderoTipo de retorno: Entero: número de valores únicos en una columna.
Ejemplo #1: Usar nunique()
En este ejemplo, el método nunique() se usa para obtener el número de todos los valores únicos en la columna Equipo.
# importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("employees.csv") # storing unique value in a variable unique_value = data["Team"].nunique() # printing value print(unique_value)
Salida:
se devuelve la salida del número de valores únicos.
10
Ejemplo #2: Manejo de valor NULL
En este ejemplo, la longitud de la array devuelta por el método unique() se compara con el número entero devuelto por el método nunique().
# importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("employees.csv") # storing unique value in a variable arr = data["Team"].unique() # storing unique value in a variable unique_value = data["Team"].nunique(dropna = True) # printing values print(len(arr), unique_value)
Salida:
la salida no es la misma en ambos casos, ya que el parámetro dropna se establece en True y, por lo tanto, los valores NULL se excluyeron al contar los valores únicos.
11 10
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA