Cuenta distinta en la agregación de Pandas

En este artículo, veamos cómo podemos contar distintos en la agregación de pandas. Entonces, para contar los distintos en la agregación de pandas, vamos a usar el método groupby() y add().  

  • groupby(): este método se utiliza para dividir los datos en grupos según algunos criterios. Los objetos de Pandas se pueden dividir en cualquiera de sus ejes. Podemos crear una agrupación de categorías y aplicar una función a las categorías. La definición abstracta de agrupación es proporcionar un mapeo de etiquetas a nombres de grupos
  • agg(): Este método se usa para pasar una función o lista de funciones a aplicar en una serie o incluso cada elemento de la serie por separado. En el caso de una lista de funciones, el método agg() devuelve múltiples resultados.

A continuación se muestran algunos ejemplos que muestran cómo contar distintos en la agregación de Pandas:

Ejemplo 1:

Python

# import module
import pandas as pd
import numpy as np
  
# create Data frame
df = pd.DataFrame({'Video_Upload_Date': ['2020-01-17',
                                         '2020-01-17',
                                         '2020-01-19',
                                         '2020-01-19',
                                         '2020-01-19'],
                   'Viewer_Id': ['031', '031', '032',
                                 '032', '032'],
                   'Watch_Time': [34, 43, 43, 41, 40]})
  
# print original Dataframe
print(df)
  
# let's Count distinct in Pandas aggregation
df = df.groupby("Video_Upload_Date").agg(
    {"Watch_Time": np.sum, "Viewer_Id": pd.Series.nunique})
  
# print final output
print(df)

Producción:

Ejemplo 2:

Python

# import module
import pandas as pd
import numpy as np
  
# create Data frame
df = pd.DataFrame({'Order Date': ['2021-02-22',
                                  '2021-02-22',
                                  '2021-02-22',
                                  '2021-02-24',
                                  '2021-02-24'],
                   'Product Id': ['021', '021',
                                  '022', '022', '022'],
                   'Order Quantity': [23, 22, 22,
                                      45, 10]})
  
# print original Dataframe
print(df)
  
# let's Count distinct in Pandas aggregation
df = df.groupby("Order Date").agg({"Order Quantity": np.sum,
                                   "Product Id": pd.Series.nunique})
  
# print final output
print(df)

Producción:

Publicación traducida automáticamente

Artículo escrito por sidgautam y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *