Obtener recuentos de frecuencia de columnas en Pandas DataFrame

Dado un marco de datos de Pandas, necesitamos encontrar los recuentos de frecuencia de cada elemento en una o más columnas de este marco de datos. Esto se puede lograr de múltiples maneras:

Método #1: UsarSeries.value_counts()

Este método es aplicable al objeto pandas.Series. Dado que cada objeto DataFrame es una colección de objetos Series, podemos aplicar este método para obtener los recuentos de frecuencia de valores en una columna.

# importing pandas as pd
import pandas as pd
  
# sample dataframe
df = pd.DataFrame({'A': ['foo', 'bar', 'g2g', 'g2g', 'g2g',
                         'bar', 'bar', 'foo', 'bar'],
                  'B': ['a', 'b', 'a', 'b', 'b', 'b', 'a', 'a', 'b'] })
  
# frequency count of column A
count = df['A'].value_counts()
print(count)

Salida:

 
Método #2: UsandoGroupBy.count()

Este método se puede utilizar para contar frecuencias de objetos en columnas individuales. Después de agrupar un objeto DataFrame en una columna, podemos aplicar count()el método en el objeto groupby resultante para obtener un objeto DataFrame que contenga el recuento de frecuencia.

# importing pandas as pd
import pandas as pd
  
# sample dataframe
df = pd.DataFrame({ 'A': ['foo', 'bar', 'g2g', 'g2g', 'g2g',
                                'bar', 'bar', 'foo', 'bar'],
                   'B': ['a', 'b', 'a', 'b', 'b', 'b', 'a', 'a', 'b'] })
  
# Multi-column frequency count
count = df.groupby(['A']).count()
print(count)

Salida:

 
Método #3: UsarGroupBy.size()

Este método se puede utilizar para contar frecuencias de objetos en columnas únicas o múltiples. Después de agrupar un objeto DataFrame en una o más columnas, podemos aplicar size()el método en el objeto groupby resultante para obtener un objeto Serie que contenga el conteo de frecuencia.

# importing pandas as pd
import pandas as pd
  
# sample dataframe
df = pd.DataFrame({ 'A': ['foo', 'bar', 'g2g', 'g2g', 'g2g', 
                                'bar', 'bar', 'foo', 'bar'],
                   'B': ['a', 'b', 'a', 'b', 'b', 'b', 'a', 'a', 'b'] })
  
# Multi-column frequency count
count = df.groupby(['A', 'B']).size()
print(count)

Producción:

Publicación traducida automáticamente

Artículo escrito por NishitJain y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *