En este artículo, discutiremos cómo crear un gráfico de barras usando tabulaciones cruzadas de pandas en Python. Primero, sepamos más sobre la tabulación cruzada. Es una simple tabulación cruzada de dos o más variables.
¿Qué es la tabulación cruzada?
Es una simple tabulación cruzada que nos ayuda a entender la relación entre dos o más variables. Dará una comprensión clara de los datos y facilitará el análisis.
Tomemos un ejemplo si tomamos un conjunto de datos de lateralidad de las personas que incluye la nacionalidad, el sexo, la edad y el nombre de las personas. Supongamos si queremos analizar la relación entre nacionalidad y preferencia de los pueblos. Crosstab te da la relación entre ellos.
Tabulación cruzada usando pandas
Antes de crear el diagrama de barras, debemos crear una tabulación cruzada usando pandas.
Sintaxis: pandas.crosstab(índice, columnas, valores=Ninguno, nombres de filas=Ninguno, nombres de columnas=Ninguno, aggfunc=Ninguno, márgenes=Falso, nombre_márgenes=’Todos’, dropna=Verdadero, normalizar=Falso
Código:
Python
# importing the pandas library import pandas as pd # Reading the csv file and storing it # in a variable df = pd.read_csv('Data.csv') # Crosstab function is called # 2 parameters are passed # The table is stored in a variable crosstb = pd.crosstab(df.Nationality, df.Handedness)
Producción:
Creación de diagramas de barras
Los gráficos de barras se utilizan principalmente para comparar entre diferentes grupos o para realizar un seguimiento de los cambios a lo largo del tiempo. El uso de diagramas de barras en la tabla de referencias cruzadas es una de las formas eficientes de concluir la tabla de referencias cruzadas y analizarlas aún mejor.
Sintaxis: DataFrame.plot.bar(x=Ninguno, y=Ninguno, **kwargs)
Código:
Python3
# importing the pandas library import pandas as pd # Reading the csv file and storing it in a variable df = pd.read_csv('Data.csv') # Creating crosstab crosstb = pd.crosstab(df.Nationality, df.Handedness) # Creating barplot barplot = crosstb.plot.bar(rot=0)
Producción:
Diagrama de barras apiladas
Aquí crearemos un gráfico de barras apiladas a través del marco de datos pasando el parámetro apilado como True.
Dataframe.plot(tipo=”barra”, apilado = Verdadero, rot=0)
Código:
Python
# importing the pandas library import pandas as pd # Reading csv file df = pd.read_csv('Data.csv') # Creating crosstab crosstb = pd.crosstab(df.Nationality, df.Handedness) # Creating barplot pl = crosstb.plot(kind="bar", stacked=True, rot=0)
Producción:
Crear diagrama de barras usando más de dos variables de la tabla de referencias cruzadas
En el ejemplo anterior, encontramos la relación entre la nacionalidad y la lateralidad de las personas. También podemos crear una tabla cruzada con más de dos valores. Implementaremos esto en el siguiente ejemplo.
Python3
# importing the module import pandas as pd # reading the csv file df = pd.read_csv('Data.csv') # Crosstab with three variables crosstb = pd.crosstab(df.Sex, [df.Nationality, df.Handedness]) # Bar ploting a = crosstb.plot(kind='bar', rot=0) a.legend(title='Handedness', bbox_to_anchor=(1, 1.02), loc='upper left')
Producción:
Publicación traducida automáticamente
Artículo escrito por shivapriya1726 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA