Pandas GroupBy: cuenta las ocurrencias en la columna

El uso del método size() o count() con pandas.DataFrame.groupby() generará el recuento de una cantidad de ocurrencias de datos presentes en una columna particular del marco de datos. Sin embargo, esta operación también se puede realizar usando pandas.Series.value_counts() y pandas.Index.value_counts() .

Acercarse

  • Módulo de importación
  • Crear o importar marco de datos
  • Aplicar grupo por
  • Usa cualquiera de los dos métodos.
  • Mostrar resultado

Método 1: Usar pandas.groupyby().si ze()

El enfoque básico para usar este método es asignar los nombres de columna como parámetros en el método groupby() y luego usar size() con él. A continuación se muestran varios ejemplos que muestran cómo contar las ocurrencias en una columna para diferentes conjuntos de datos.

Ejemplo 1:

En este ejemplo, contamos por separado las ocurrencias de todas las columnas presentes en un conjunto de datos.

Python3

# import module
import pandas as pd
 
 
# assign data
data = pd.DataFrame({'Section': ['A', 'A', 'A', 'B', 'B',
                                 'B', 'C', 'C', 'C'],
                     'Teacher': ['Kakeshi', 'Kakeshi', 'Iruka',
                                 'Kakeshi', 'Kakeshi', 'Kakeshi',
                                 'Iruka', 'Iruka', 'Guy']})
 
# display dataframe
print('Data:')
display(data)
 
 
print('Occurrence counts of particular columns:')
 
# count occurrences a particular column
occur = data.groupby(['Section']).size()
 
# display occurrences of a particular column
display(occur)
 
# count occurrences a particular column
occur = data.groupby(['Teacher']).size()
 
# display occurrences of a particular column
display(occur)

Producción:

Ejemplo 2:

En el siguiente programa, contamos las ocurrencias de todas las columnas combinadas del mismo conjunto de datos que se usó en el programa anterior.

Python3

# import module
import pandas as pd
 
 
# assign data
data = pd.DataFrame({'Section': ['A', 'A', 'A', 'B', 'B', 'B',
                                 'C', 'C', 'C'],
                     'Teacher': ['Kakeshi', 'Kakeshi', 'Iruka',
                                 'Kakeshi', 'Kakeshi', 'Kakeshi',
                                 'Iruka', 'Iruka', 'Guy']})
 
# display dataframe
print('Data:')
display(data)
 
 
print('Occurrence counts of combined columns:')
 
# count occurrences of combined columns
occur = data.groupby(['Section', 'Teacher']).size()
 
# display occurrences of combined columns
display(occur)

Producción:

Ejemplo 3:

Aquí, separamos las ocurrencias de recuento y las ocurrencias de recuento combinadas de las columnas categóricas presentes en un archivo CSV .

Python3

# import module
import pandas as pd
 
 
# assign data
data = pd.read_csv('diamonds.csv')
 
# display dataframe
print('Data:')
display(data.sample(10))
 
print('Occurrence counts of particular column:')
 
# count occurrences a particular column
occur = data.groupby(['cut']).size()
 
# display occurrences of a particular column
display(occur)
 
print('Occurrence counts of combined columns:')
 
# count occurrences of combined columns
occur = data.groupby(['clarity', 'color', 'cut']).size()
 
# display occurrences of combined columns
display(occur)

Producción:

Método 2: Usar pandas.groupyby().count ()

El enfoque básico para usar este método es asignar los nombres de las columnas como parámetros en el método groupby() y luego usar count() con él. A continuación se muestran varios ejemplos que muestran cómo contar las ocurrencias en una columna para diferentes conjuntos de datos.

Ejemplo 1:

En este ejemplo, contamos por separado las ocurrencias de todas las columnas presentes en un conjunto de datos.

Python3

# import module
import pandas as pd
 
 
# assign data
data = pd.DataFrame({'Section': ['A', 'A', 'A', 'B', 'B', 'B',
                                 'C', 'C', 'C'],
                     'Teacher': ['Kakeshi', 'Kakeshi', 'Iruka',
                                 'Kakeshi', 'Kakeshi', 'Kakeshi',
                                 'Iruka', 'Iruka', 'Guy']})
 
# display dataframe
print('Data:')
display(data)
 
print('Occurrence counts of particular columns:')
 
# count occurrences a particular column
occur = data.groupby(['Section']).size()
 
# display occurrences of a particular column
display(occur)
 
# count occurrences a particular column
occur = data.groupby(['Teacher']).size()
 
# display occurrences of a particular column
display(occur)

Producción:

Ejemplo 2:

En el siguiente programa, contamos las ocurrencias de todas las columnas combinadas del mismo conjunto de datos que se usó en el programa anterior.

Python3

# import module
import pandas as pd
 
 
# assign data
data = pd.DataFrame({'Section': ['A', 'A', 'A', 'B', 'B', 'B',
                                 'C', 'C', 'C'],
                     'Teacher': ['Kakeshi', 'Kakeshi', 'Iruka',
                                 'Kakeshi', 'Kakeshi', 'Kakeshi',
                                 'Iruka', 'Iruka', 'Guy']})
 
# display dataframe
print('Data:')
display(data)
 
print('Occurrence counts of combined columns:')
 
# count occurrences of combined columns
occur = data.groupby(['Section', 'Teacher']).size()
 
# display occurrences of combined columns
display(occur)

Producción:

Ejemplo 3:

Aquí, separamos las ocurrencias de recuento y las ocurrencias de recuento combinadas de las columnas categóricas presentes en un archivo CSV .

Python3

# import module
import pandas as pd
 
 
# assign data
data = pd.read_csv('diamonds.csv')
 
# display dataframe
print('Data:')
display(data.sample(10))
 
 
print('Occurrence counts of particular column:')
 
# count occurrences a particular column
occur = data.groupby(['cut']).size()
 
# display occurrences of a particular column
display(occur)
 
 
print('Occurrence counts of combined columns:')
 
# count occurrences of combined columns
occur = data.groupby(['clarity', 'color', 'cut']).size()
 
# display occurrences of combined columns
display(occur)

Producción:

Publicación traducida automáticamente

Artículo escrito por riturajsaha y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *