Uso de tabulaciones cruzadas de pandas para crear un gráfico de barras

En este artículo, discutiremos cómo crear un gráfico de barras usando tabulaciones cruzadas de pandas en Python. Primero, sepamos más sobre la tabulación cruzada. Es una simple tabulación cruzada de dos o más variables.

¿Qué es la tabulación cruzada?

Es una simple tabulación cruzada que nos ayuda a entender la relación entre dos o más variables. Dará una comprensión clara de los datos y facilitará el análisis.  

Tomemos un ejemplo si tomamos un conjunto de datos de lateralidad de las personas que incluye la nacionalidad, el sexo, la edad y el nombre de las personas. Supongamos si queremos analizar la relación entre nacionalidad y preferencia de los pueblos. Crosstab te da la relación entre ellos.

Tabulación cruzada usando pandas

Antes de crear el diagrama de barras, debemos crear una tabulación cruzada usando pandas.

Sintaxis: pandas.crosstab(índice, columnas, valores=Ninguno, nombres de filas=Ninguno, nombres de columnas=Ninguno, aggfunc=Ninguno, márgenes=Falso, nombre_márgenes=’Todos’, dropna=Verdadero, normalizar=Falso

Código:

Python

# importing the pandas library
import pandas as pd
 
# Reading the csv file and storing it
# in a variable
df = pd.read_csv('Data.csv')
 
# Crosstab function is called
# 2 parameters are passed
# The table is stored in a variable
crosstb = pd.crosstab(df.Nationality, df.Handedness)

Producción:

Creación de diagramas de barras

Los gráficos de barras se utilizan principalmente para comparar entre diferentes grupos o para realizar un seguimiento de los cambios a lo largo del tiempo. El uso de diagramas de barras en la tabla de referencias cruzadas es una de las formas eficientes de concluir la tabla de referencias cruzadas y analizarlas aún mejor.

Sintaxis: DataFrame.plot.bar(x=Ninguno, y=Ninguno, **kwargs)

Código:

Python3

# importing the pandas library
import pandas as pd
 
# Reading the csv file and storing it in a variable
df = pd.read_csv('Data.csv')
 
# Creating crosstab
crosstb = pd.crosstab(df.Nationality, df.Handedness)
 
# Creating barplot
barplot = crosstb.plot.bar(rot=0)

Producción:

Diagrama de barras apiladas

Aquí crearemos un gráfico de barras apiladas a través del marco de datos pasando el parámetro apilado como True.

Dataframe.plot(tipo=”barra”, apilado = Verdadero, rot=0)

Código:

Python

# importing the pandas library
import pandas as pd
 
# Reading csv file
df = pd.read_csv('Data.csv')
 
# Creating crosstab
crosstb = pd.crosstab(df.Nationality, df.Handedness)
 
# Creating barplot
pl = crosstb.plot(kind="bar", stacked=True, rot=0)

Producción:

Crear diagrama de barras usando más de dos variables de la tabla de referencias cruzadas

En el ejemplo anterior, encontramos la relación entre la nacionalidad y la lateralidad de las personas. También podemos crear una tabla cruzada con más de dos valores. Implementaremos esto en el siguiente ejemplo. 

Python3

# importing the module
import pandas as pd
 
# reading the csv file
df = pd.read_csv('Data.csv')
 
# Crosstab with three variables
crosstb = pd.crosstab(df.Sex, [df.Nationality,
                               df.Handedness])
 
# Bar ploting
a = crosstb.plot(kind='bar', rot=0)
a.legend(title='Handedness', bbox_to_anchor=(1, 1.02),
         loc='upper left')

Producción:

Publicación traducida automáticamente

Artículo escrito por shivapriya1726 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *