Python | Pandas Index.factorizar()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

La función Pandas Index.factorize()codifica el objeto como un tipo enumerado o una variable categórica. Este método es útil para obtener una representación numérica de una array cuando todo lo que importa es identificar valores distintos. factorize está disponible como función de nivel superior pandas.factorize() y como método Series.factorize() e Index.factorize().

Sintaxis: Index.factorize(sort=False, na_sentinel=-1)

Parámetros:
ordenar : ordene los únicos y mezcle las etiquetas para mantener la relación.
na_sentinel : Valor a marcar como “no encontrado”.

Devuelve: un ndarray entero que es un indexador en únicos. uniques.take(labels) tendrá los mismos valores que los valores.

Ejemplo #1: Use Index.factorize()la función para codificar los valores de índice dados en forma categórica.

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',
                     'Lhasa', 'Husky', 'Beagle'])
  
# Print the Index
idx

Producción :

Factoricemos el Índice dado.

# convert it into categorical values.
idx.factorize()

Salida:

Como podemos ver en la salida, la Index.factorize()función ha convertido cada etiqueta en el Índice a una categoría y les ha asignado valores numéricos.
 
Ejemplo n.º 2: use Index.factorize()la función para factorizar los valores del índice en función de su secuencia de orden ordenado.

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index(['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun',
               'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'])
  
# Print the Index
idx

Producción :

Vamos a factorizarlo según el orden ordenado. Los valores numéricos se asignan solo después de ordenar los valores en el Índice.

# Factorize the sorted labels
idx.factorize(sort = True)

Salida:

como podemos ver en la salida, se ha realizado una clasificación en los valores del índice antes de asignarles valores numéricos.

Publicación traducida automáticamente

Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *