función pandas.crosstab() en Python

Este método se utiliza para calcular una simple tabulación cruzada de dos (o más) factores. De forma predeterminada, calcula una tabla de frecuencia de los factores a menos que se pase una array de valores y una función de agregación.

Sintaxis: pandas.crosstab(índice, columnas, valores=Ninguno, nombres de filas=Ninguno, nombres de columnas=Ninguno, aggfunc=Ninguno, márgenes=False, margins_name=’All’, dropna=True, normalize=False)

Argumentos:

  • índice: similar a una array, serie o lista de arrays/series, valores para agrupar en las filas.
  • columnas: tipo array, serie o lista de arrays/series, valores para agrupar en las columnas.
  • valores : tipo array, opcional, array de valores para agregar según los factores. Requiere que se especifique `aggfunc`.
  • nombres de fila: secuencia, predeterminado Ninguno, si se pasa, debe coincidir con el número de arrays de filas pasadas.
  • colnames : secuencia, predeterminado Ninguno, si se pasa, debe coincidir con el número de arrays de columnas pasadas.
  • aggfunc: función, opcional, si se especifica, requiere que también se especifiquen `valores`.
  • margins : bool, default False, Agregar márgenes de fila/columna (subtotales).
  • margins_name : str, por defecto ‘Todos’, Nombre de la fila/columna que contendrá los totales cuando los márgenes sean Verdaderos.
  • dropna: bool, predeterminado True, no incluya columnas cuyas entradas sean todas NaN.

A continuación se muestra la implementación del método anterior con algunos ejemplos:

Ejemplo 1 :

Python3

# importing packages
import pandas
import numpy
  
# creating some data
a = numpy.array(["foo", "foo", "foo", "foo",
                 "bar", "bar", "bar", "bar",
                 "foo", "foo", "foo"],
                dtype=object)
  
b = numpy.array(["one", "one", "one", "two",
                 "one", "one", "one", "two",
                 "two", "two", "one"],
                dtype=object)
  
c = numpy.array(["dull", "dull", "shiny",
                 "dull", "dull", "shiny",
                 "shiny", "dull", "shiny",
                 "shiny", "shiny"],
                dtype=object)
  
# form the cross tab
pandas.crosstab(a, [b, c], rownames=['a'], colnames=['b', 'c'])

Producción :

Ejemplo 2:

Python3

# importing package
import pandas
  
# create some data
foo = pandas.Categorical(['a', 'b'], 
                         categories=['a', 'b', 'c'])
  
bar = pandas.Categorical(['d', 'e'], 
                         categories=['d', 'e', 'f'])
  
# form crosstab with dropna=True (default)
pandas.crosstab(foo, bar)
  
# form crosstab with dropna=False
pandas.crosstab(foo, bar, dropna=False)

Producción :

Publicación traducida automáticamente

Artículo escrito por deepanshu_rustagi y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *