Python | Serie Pandas.factorizar()

La serie Pandas es un ndarray unidimensional con etiquetas de eje. No es necesario que las etiquetas sean únicas, pero deben ser de tipo hashable. El objeto admite la indexación basada en enteros y etiquetas y proporciona una gran cantidad de métodos para realizar operaciones relacionadas con el índice.

La función Pandas Series.factorize()codifica el objeto como un tipo enumerado o una variable categórica. Este método es útil para obtener una representación numérica de una array cuando todo lo que importa es identificar valores distintos.

Sintaxis: Series.factorize(sort=False, na_sentinel=-1)

Parámetro :
sort : ordena los únicos y mezcla las etiquetas para mantener la relación.
na_sentinel : Valor a marcar como “no encontrado”.

Devoluciones:
etiquetas: ndarray
únicos: ndarray, índice o categórico

Ejemplo #1: Use Series.factorize()la función para codificar los datos subyacentes del objeto de serie dado.

# importing pandas as pd
import pandas as pd
  
# Creating the Series
sr = pd.Series(['New York', 'Chicago', 'Toronto', None, 'Rio'])
  
# Create the Index
sr.index = ['City 1', 'City 2', 'City 3', 'City 4', 'City 5'] 
  
# set the index
sr.index = index_
  
# Print the series
print(sr)

Producción :


Now we will use Series.factorize() function to encode the underlying data of the given series object.

# encode the values
result = sr.factorize()
  
# Print the result
print(result)

Salida:

como podemos ver en la salida, la Series.factorize()función ha codificado con éxito los datos subyacentes del objeto de serie dado. Observe que a los valores faltantes se les ha asignado un código de -1.
 
Ejemplo #2: use Series.factorize()la función para codificar los datos subyacentes del objeto de serie dado.

# importing pandas as pd
import pandas as pd
  
# Creating the Series
sr = pd.Series([80, 25, 3, 80, 24, 25])
  
# Create the Index
index_ = ['Coca Cola', 'Sprite', 'Coke', 'Fanta', 'Dew', 'ThumbsUp']
  
# set the index
sr.index = index_
  
# Print the series
print(sr)

Producción :

Ahora usaremos Series.factorize()la función para codificar los datos subyacentes del objeto de serie dado.

# encode the values
result = sr.factorize()
  
# Print the result
print(result)

Salida:

como podemos ver en la salida, la Series.factorize()función ha codificado con éxito los datos subyacentes del objeto de serie dado.

Publicación traducida automáticamente

Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *