Series.str
se puede usar para acceder a los valores de la serie como strings y aplicarle varios métodos. La función Pandas Series.str.extractall()
se usa para extraer grupos de captura en la expresión regular pat como columnas en un DataFrame. Para cada string de asunto de la Serie, extraiga grupos de todas las coincidencias de la expresión regular pat. Cuando cada string de asunto en la Serie tiene exactamente una coincidencia, extractall(pat).xs(0, level=’match’) es lo mismo que extract(pat).
Sintaxis: Series.str.extractall(pat, flags=0)
Parámetro:
pat: patrón de expresión regular con grupos de captura.
flags : Un indicador de módulo re, por ejemplo re.IGNORECASE.Devoluciones: marco de datos
Ejemplo #1: Use Series.str.extractall()
la función para extraer todos los grupos de la string en los datos subyacentes del objeto de serie dado.
# importing pandas as pd import pandas as pd # importing re for regular expressions import re # Creating the Series sr = pd.Series(['New_York', 'Lisbon', 'Tokyo', 'Paris', 'Munich']) # Creating the index idx = ['City 1', 'City 2', 'City 3', 'City 4', 'City 5'] # set the index sr.index = idx # Print the series print(sr)
Producción :
Ahora usaremos Series.str.extractall()
la función para extraer todos los grupos de las strings en el objeto de serie dado.
# extract all groups having a vowel followed by # any character result = sr.str.extractall(pat = '([aeiou].)') # print the result print(result)
Producción :
Como podemos ver en la salida, la Series.str.extractall()
función ha devuelto un marco de datos que contiene una columna de todo el grupo extraído.
Ejemplo #2: use Series.str.extractall()
la función para extraer todos los grupos de la string en los datos subyacentes del objeto de serie dado.
# importing pandas as pd import pandas as pd # importing re for regular expressions import re # Creating the Series sr = pd.Series(['Mike', 'Alessa', 'Nick', 'Kim', 'Britney']) # Creating the index idx = ['Name 1', 'Name 2', 'Name 3', 'Name 4', 'Name 5'] # set the index sr.index = idx # Print the series print(sr)
Producción :
Ahora usaremos Series.str.extractall()
la función para extraer todos los grupos de las strings en el objeto de serie dado.
# extract all groups having any capital letter # followed by 'i' and any other character result = sr.str.extractall(pat = '([A-Z]i.)') # print the result print(result)
Producción :
Como podemos ver en la salida, la Series.str.extractall()
función ha devuelto un marco de datos que contiene una columna de todo el grupo extraído.
Publicación traducida automáticamente
Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA