Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
El método Pandas str.find() se usa para buscar una substring en cada string presente en una serie. Si se encuentra la string, devuelve el índice más bajo de su ocurrencia. Si no se encuentra la string, devolverá -1.
Los puntos de inicio y final también se pueden pasar para buscar una parte específica de la string para el carácter o la substring pasados.
Sintaxis: Series.str.find(sub, start=0, end=Ninguno)
Parámetros:
sub: String o carácter a buscar en el valor de texto en series
start: valor int, punto de inicio de la búsqueda. El valor predeterminado es 0, lo que significa desde el principio de la string hasta el
final: valor int, punto final donde debe detenerse la búsqueda. El valor predeterminado es Ninguno.
Tipo de retorno: Serie con posición de índice de aparición de substring
Para descargar el CSV utilizado en el código, haga clic aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.
Ejemplo #1: Búsqueda de un solo carácter
En este ejemplo, se busca un solo carácter ‘a’ en cada string de la columna Nombre usando el método str.find(). Los parámetros de inicio y finalización se mantienen predeterminados. La serie devuelta se almacena en una nueva columna para que los índices se puedan comparar mirando directamente. Antes de aplicar este método, las filas nulas se descartan mediante .dropna() para evitar errores.
Python3
# importing pandas module import pandas as pd # reading csv file from url data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # dropping null value columns to avoid errors data.dropna(inplace = True) # substring to be searched sub ='a' # creating and passing series to new column data["Indexes"]= data["Name"].str.find(sub) # display data
Salida:
como se muestra en la imagen de salida, la aparición de índice en la columna Índices es igual a la posición de la primera aparición de carácter en la string. Si la substring no existe en el texto, se devuelve -1. También se puede ver al mirar la primera fila que no se consideró ‘A’, lo que prueba que este método distingue entre mayúsculas y minúsculas.
Ejemplo #2: Búsqueda de substring (más de un carácter)
En este ejemplo, se buscará la substring ‘er’ en la columna Nombre del marco de datos. El parámetro de inicio se mantiene en 2 para iniciar la búsqueda desde el tercer elemento (posición de índice 2).
Python3
# importing pandas module import pandas as pd # reading csv file from url data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") # dropping null value columns to avoid errors data.dropna(inplace = True) # substring to be searched sub ='er' # start var start = 2 # creating and passing series to new column data["Indexes"]= data["Name"].str.find(sub, start) # display data
Salida:
como se muestra en la imagen de salida, se devuelve el menor índice de aparición de substring. Pero se puede ver, en el caso de Terry Rozier (Fila 9 en el marco de datos), en lugar de la primera aparición de ‘er’, se devolvió 10. Esto se debe a que el parámetro de inicio se mantuvo en 2 y el primer ‘er’ aparece antes.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA