requisitos previos:
La visualización de datos es la parte más importante de cualquier análisis. Matplotlib es una increíble biblioteca de python que se puede usar para trazar el marco de datos de pandas. Hay varias formas en las que se puede generar un gráfico según el requisito.
Comparación entre datos categóricos
Bar Plot es uno de esos ejemplos. Para trazar un gráfico de barras se utilizará la función plot().
Sintaxis:
Ejemplo:
Python3
# importing pandas library import pandas as pd # importing matplotlib library import matplotlib.pyplot as plt # creating dataframe df = pd.DataFrame({ 'Name': ['John', 'Sammy', 'Joe'], 'Age': [45, 38, 90] }) # plotting a bar graph df.plot(x="Name", y="Age", kind="bar")
Producción:
Visualización de datos continuos
El histograma es un ejemplo de representación de datos divididos en intervalos estrechamente relacionados. Para esto se empleará la función hist().
Sintaxis:
Ejemplo:
Python3
# importing pandas library import pandas as pd # importing matplotlib library import matplotlib.pyplot as plt # creating dataframe df = pd.DataFrame({ 'Age': [45, 38, 90, 60, 40, 50, 2, 32, 8, 15, 27, 69, 73, 55] }) # plotting a histogram plt.hist(df["Age"]) plt.show()
Producción:
Para la distribución de datos
El gráfico circular es una excelente manera de representar datos que son parte de un todo. Para trazar un gráfico circular, se utilizará la función pie().
Sintaxis:
Ejemplo:
Python3
# importing pandas library import pandas as pd # importing matplotlib library import matplotlib.pyplot as plt # creating dataframe df = pd.DataFrame({ 'Object': ['Bulb', 'Lamp', 'Table', 'Pen', 'Notebook'], 'Price': [45, 38, 90, 60, 40] }) # plotting a pie chart plt.pie(df["Price"], labels=df["Object"]) plt.show()
Producción:
Dependencia de datos
En situaciones en las que los datos deben interpretarse en función de parámetros dependientes y no dependientes, se utilizan gráficos como el gráfico de líneas o el gráfico de dispersión. Para trazar un gráfico de líneas, la función plot() es suficiente, pero para visualizar un gráfico de dispersión, se usa scatter().
Sintaxis:
Ejemplo:
Python3
# importing pandas library import pandas as pd # importing matplotlib library import matplotlib.pyplot as plt # creating dataframe df = pd.DataFrame({ 'X': [1, 2, 3, 4, 5], 'Y': [2, 4, 6, 10, 15] }) # plotting a line graph print("Line graph: ") plt.plot(df["X"], df["Y"]) plt.show() # plotting a scatter plot print("Scatter Plot: ") plt.scatter(df["X"], df["Y"]) plt.show()
Producción: