Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos. El método str.rfind() de
Pandas se usa para buscar una substring en cada string presente en una serie desde el lado derecho. Si se encuentra la string, devuelve el índice más alto de su ocurrencia. Si no se encuentra la string, devolverá -1. Los puntos de inicio y final también se pueden pasar para buscar una parte específica de la string para el carácter o la substring pasados.
Sintaxis: Series.str.rfind(sub, start=0, end=Ninguno)
Parámetros:
sub: String o carácter a buscar en el valor de texto en series
start: valor int, punto de inicio de la búsqueda. El valor predeterminado es 0, lo que significa desde el principio de la string hasta el
final: valor int, punto final donde debe detenerse la búsqueda. El valor predeterminado es Ninguno.
Tipo de valor devuelto: serie con la posición de índice más alta de aparición de substring
Para descargar el CSV utilizado en el código, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.
Ejemplo #1: Búsqueda de un solo carácter
En este ejemplo, se busca un solo carácter ‘r’ desde el lado derecho en cada string de la columna Nombre usando el método str.rfind(). Los parámetros de inicio y finalización se mantienen predeterminados. La serie devuelta se almacena en una nueva columna para que los índices se puedan comparar mirando directamente. Antes de aplicar este método, las filas nulas se descartan mediante .dropna() para evitar errores.
Python3
# importing pandas module import pandas as pd # reading csv file from url data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # dropping null value columns to avoid errors data.dropna(inplace = True) # substring to be searched sub ='r' # creating and passing series to new column data["Indexes"]= data["Name"].str.rfind(sub) # display data
Salida:
como se muestra en la imagen de salida, la aparición de índice en la columna Índices es igual a la posición de la Última aparición de carácter en la string. Si la substring no existe en el texto, se devuelve -1.
Ejemplo #2: Búsqueda de substring (más de un carácter)
En este ejemplo, se buscará la substring ‘ey’ en la columna Nombre del marco de datos. El parámetro de inicio se mantiene en 2 para iniciar la búsqueda desde el tercer elemento (posición de índice 2).
Python3
# importing pandas module import pandas as pd # reading csv file from url data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/upload/nba.csv") # dropping null value columns to avoid errors data.dropna(inplace = True) # substring to be searched sub ='ey' # start var start = 2 # creating and passing series to new column data["Indexes"]= data["Name"].str.rfind(sub, start) # display data
Salida:
como se muestra en la imagen de salida, se devuelve el índice más alto o último de ocurrencia de la substring.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA