Python | Serie Pandas.str.extract()

Series.strse puede usar para acceder a los valores de la serie como strings y aplicarle varios métodos. La función Pandas Series.str.extract()se usa para extraer grupos de captura en la expresión regular pat como columnas en un DataFrame. Para cada string de asunto de la Serie, extraiga grupos de la primera coincidencia de la expresión regular pat .

Sintaxis: Series.str.extract(pat, flags=0, expand=True)

Parámetro:
pat: patrón de expresión regular con grupos de captura.
flags: int, predeterminado 0 (sin flags)
expand: si es True, devuelve DataFrame con una columna por grupo de captura.

Devoluciones: trama de datos o serie o índice

Ejemplo #1: Use Series.str.extract()la función para extraer grupos de la string en los datos subyacentes del objeto de serie dado.

# importing pandas as pd
import pandas as pd
  
# importing re for regular expressions
import re
  
# Creating the Series
sr = pd.Series(['New_York', 'Lisbon', 'Tokyo', 'Paris', 'Munich'])
  
# Creating the index
idx = ['City 1', 'City 2', 'City 3', 'City 4', 'City 5']
  
# set the index
sr.index = idx
  
# Print the series
print(sr)

Producción :

Ahora usaremos Series.str.extract()la función para extraer grupos de las strings en el objeto de serie dado.

# extract groups having a vowel followed by
# any character
result = sr.str.extract(pat = '([aeiou].)')
  
# print the result
print(result)

Producción :

Como podemos ver en la salida, la Series.str.extract()función ha devuelto un marco de datos que contiene una columna del grupo extraído.

Ejemplo #2: use Series.str.extract()la función para extraer grupos de la string en los datos subyacentes del objeto de serie dado.

# importing pandas as pd
import pandas as pd
  
# importing re for regular expressions
import re
  
# Creating the Series
sr = pd.Series(['Mike', 'Alessa', 'Nick', 'Kim', 'Britney'])
  
# Creating the index
idx = ['Name 1', 'Name 2', 'Name 3', 'Name 4', 'Name 5']
  
# set the index
sr.index = idx
  
# Print the series
print(sr)

Producción :

Ahora usaremos Series.str.extract()la función para extraer grupos de las strings en el objeto de serie dado.

# extract groups having any capital letter
# followed by 'i' and any other character
result = sr.str.extract(pat = '([A-Z]i.)')
  
# print the result
print(result)

Producción :

Como podemos ver en la salida, la Series.str.extract()función ha devuelto un marco de datos que contiene una columna del grupo extraído.

Publicación traducida automáticamente

Artículo escrito por Shubham__Ranjan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *