Series.str
se puede usar para acceder a los valores de la serie como strings y aplicarle varios métodos. La función Pandas Series.str.extract()
se usa para extraer grupos de captura en la expresión regular pat como columnas en un DataFrame. Para cada string de asunto de la Serie, extraiga grupos de la primera coincidencia de la expresión regular pat .
Sintaxis: Series.str.extract(pat, flags=0, expand=True)
Parámetro:
pat: patrón de expresión regular con grupos de captura.
flags: int, predeterminado 0 (sin flags)
expand: si es True, devuelve DataFrame con una columna por grupo de captura.Devoluciones: trama de datos o serie o índice
Ejemplo #1: Use Series.str.extract()
la función para extraer grupos de la string en los datos subyacentes del objeto de serie dado.
# importing pandas as pd import pandas as pd # importing re for regular expressions import re # Creating the Series sr = pd.Series(['New_York', 'Lisbon', 'Tokyo', 'Paris', 'Munich']) # Creating the index idx = ['City 1', 'City 2', 'City 3', 'City 4', 'City 5'] # set the index sr.index = idx # Print the series print(sr)
Producción :
Ahora usaremos Series.str.extract()
la función para extraer grupos de las strings en el objeto de serie dado.
# extract groups having a vowel followed by # any character result = sr.str.extract(pat = '([aeiou].)') # print the result print(result)
Producción :
Como podemos ver en la salida, la Series.str.extract()
función ha devuelto un marco de datos que contiene una columna del grupo extraído.
Ejemplo #2: use Series.str.extract()
la función para extraer grupos de la string en los datos subyacentes del objeto de serie dado.
# importing pandas as pd import pandas as pd # importing re for regular expressions import re # Creating the Series sr = pd.Series(['Mike', 'Alessa', 'Nick', 'Kim', 'Britney']) # Creating the index idx = ['Name 1', 'Name 2', 'Name 3', 'Name 4', 'Name 5'] # set the index sr.index = idx # Print the series print(sr)
Producción :
Ahora usaremos Series.str.extract()
la función para extraer grupos de las strings en el objeto de serie dado.
# extract groups having any capital letter # followed by 'i' and any other character result = sr.str.extract(pat = '([A-Z]i.)') # print the result print(result)
Producción :
Como podemos ver en la salida, la Series.str.extract()
función ha devuelto un marco de datos que contiene una columna del grupo extraído.
Publicación traducida automáticamente
Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA