Vamos a crear un marco de datos simple:
Python
# importing required library # In case pandas is not installed on your machine # use the command 'pip install pandas'. import pandas as pd import matplotlib.pyplot as plt # A dictionary which represents data data_dict = { 'name':['p1','p2','p3','p4','p5','p6'], 'age':[20,20,21,20,21,20], 'math_marks':[100,90,91,98,92,95], 'physics_marks':[90,100,91,92,98,95], 'chem_marks' :[93,89,99,92,94,92] } # creating a data frame object df = pd.DataFrame(data_dict) # show the dataframe # bydefault head() show # first five rows from top df.head()
Producción:
Parcelas
Hay una serie de gráficos disponibles para interpretar los datos. Cada gráfico se utiliza para un propósito. Algunas de las gráficas son BarPlots, ScatterPlots e Histograms, etc.
Gráfico de dispersión:
Para obtener el diagrama de dispersión de un marco de datos, todo lo que tenemos que hacer es simplemente llamar al método plot() especificando algunos parámetros.
kind='scatter',x= 'some_column',y='some_colum',color='somecolor'
Python3
# scatter plot df.plot(kind = 'scatter', x = 'math_marks', y = 'physics_marks', color = 'red') # set the title plt.title('ScatterPlot') # show the plot plt.show()
Producción:
Hay muchas formas de personalizar las parcelas, esta es la básica.
Parcela de barras:
De manera similar, tenemos que especificar algunos parámetros para el método plot() para obtener el gráfico de barras.
kind='bar',x= 'some_column',y='some_colum',color='somecolor'
Python3
# bar plot df.plot(kind = 'bar', x = 'name', y = 'physics_marks', color = 'green') # set the title plt.title('BarPlot') # show the plot plt.show()
Producción:
Gráfico de línea:
El gráfico de líneas de una sola columna no siempre es útil, para obtener más información tenemos que trazar varias columnas en el mismo gráfico. Para ello tenemos que reutilizar los ejes.
kind=’línea’,x= ‘alguna_columna’,y=’alguna_columna’,color=’algúncolor’,ax=’algunosejes’
Python3
#Get current axis ax = plt.gca() # line plot for math marks df.plot(kind = 'line', x = 'name', y = 'math_marks', color = 'green',ax = ax) # line plot for physics marks df.plot(kind = 'line',x = 'name', y = 'physics_marks', color = 'blue',ax = ax) # line plot for chemistry marks df.plot(kind = 'line',x = 'name', y = 'chem_marks', color = 'black',ax = ax) # set the title plt.title('LinePlots') # show the plot plt.show()
Producción: