Python | Serie Pandas.str.count()

Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

El método Pandas str.count()se usa para contar la aparición de una string o un patrón de expresiones regulares en cada string de una serie. También se pueden pasar argumentos de banderas adicionales a handle para modificar algunos aspectos de expresiones regulares como la distinción entre mayúsculas y minúsculas, la coincidencia de varias líneas, etc.

Dado que este es un método de string de pandas, solo es aplicable en series de strings y .str debe tener el prefijo cada vez antes de llamar a este método. De lo contrario, dará un error.

Sintaxis: Series.str.count(pat, flags=0)

Parámetros:
pat: string o expresión regular que se buscará en las strings presentes en la serie
indicadores: indicadores Regex que se pueden pasar (A, S, L, M, I, X), el valor predeterminado es 0, lo que significa Ninguno. Para este módulo regex (re) también se debe importar.

Tipo de valor devuelto: Serie con recuento de ocurrencia de caracteres pasados ​​en cada string.

Para descargar el CSV utilizado en el código, haga clic aquí.

En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. La imagen del marco de datos antes de cualquier operación se adjunta a continuación.

Ejemplo #1: Conteo de ocurrencia de palabras
En este ejemplo, una serie de Pandas se crea a partir de una lista y la ocurrencia de gfg se cuenta usando el método str.count().

# importing pandas package
import pandas as pd
  
# making list
list =["GeeksforGeeks", "Geeksforgeeks", "geeksforgeeks",
       "geeksforgeeks is a great platform", "for tech geeks"]
  
# making series
series = pd.Series(list)
  
# counting occurrence of geeks
count = series.str.count("geeks")
  
# display
count

Salida:
como se muestra en la imagen de salida, se mostró la aparición de geeks en cada string y no se contaron los geeks debido a la primera letra mayúscula.

 
Ejemplo #2: Uso de banderas

En este ejemplo, la aparición de «a» se cuenta en la columna Nombre. El parámetro flag también se usa y se le pasa re.I, lo que significa IGNORECASE. Por lo tanto, tanto a como A se considerarán durante el conteo.

# importing pandas module 
import pandas as pd
  
# importing module for regex
import re
  
# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
  
# String to be searched in start of string 
search ="a"
  
# count of occurrence of a and creating new column
data["count"]= data["Name"].str.count(search, re.I)
  
# display
data

Salida:
como se muestra en la imagen de salida, se puede comparar claramente mirando el primer índice en sí mismo, el recuento de a en Avery Bradely es 2, lo que significa que se consideraron mayúsculas y minúsculas.

Publicación traducida automáticamente

Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *