Python | Serie Pandas.str.index()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

El método Pandas str.index() se usa para buscar y devolver el índice más bajo de una substring en una sección particular (entre el inicio y el final) de cada string en una serie. Este método funciona de manera similar a str.find() pero en el caso de que no se encuentre, en lugar de devolver -1, str.index() da un ValueError.

Sintaxis: Series.str.index(sub, start=0, end=Ninguno)

Parámetros:
sub: string o carácter que se buscará en el valor de texto de la serie
inicio: string o carácter que se buscará en el valor de texto de la serie
final: string o carácter que se buscará en el valor de texto de la serie

Tipo de valor devuelto: serie con el índice mínimo de substring si se encuentra.

Para descargar el conjunto de datos utilizado en el siguiente ejemplo, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.

Ejemplo #1: Encontrar el índice cuando existe una substring en cada string

En este ejemplo, ‘e’ se pasa como substring. Dado que ‘e’ existe en las 5 strings, se devuelve el índice mínimo de su aparición. Antes de aplicar cualquier operación, las filas nulas se eliminaron utilizando el método .dropna().

# importing pandas module 
import pandas as pd
  
# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
   
# dropping null value columns to avoid errors
data.dropna(inplace = True)
  
# extracting 5 rows
short_data = data.head().copy()
  
# calling str.index() method
short_data["Index Name"]= short_data["Name"].str.index("e")
  
# display
short_data

Salida:
como se muestra en la imagen de salida, el índice mínimo de ‘e’ en serie se devolvió y almacenó en una nueva columna.

 
Ejemplo #2:

En este ejemplo, ‘a’ se busca en las primeras 5 filas. Dado que ‘a’ no existe en todas las strings, se devolverá un error de valor. Para manejar el error, se usa probar y excepto.

# importing pandas module 
import pandas as pd
  
# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
   
# dropping null value columns to avoid errors
data.dropna(inplace = True)
  
# extracting 5 rows
short_data = data.head().copy()
  
# calling str.index() method
try:
    short_data["Index Name"]= short_data["Name"].str.index("a")
except Exception as err:
    print(err)
      
# display
short_data

Salida:
como se muestra en la imagen de salida, el marco de datos de salida no tiene la columna Nombre de índice y se imprimió el error «substring no encontrada». Esto se debe a que str.index() devuelve valueError si no se encuentra y, por lo tanto, debe haber ido a exceptuar el caso e imprimir el error.

Publicación traducida automáticamente

Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *