Requisito previo:
La presentación de datos gráficamente para emitir alguna información se conoce como visualización de datos. Básicamente es una imagen para ayudar a una persona a interpretar lo que representan los datos y estudiarlos y su naturaleza en detalle. Tratar con datos a gran escala en filas es una tarea extremadamente tediosa, por lo que la visualización de datos sirve como una alternativa ideal.
Seaborn es una biblioteca de Python que se basa en matplotlib y se utiliza para la visualización de datos. Proporciona un medio para presentar datos en un formato de gráfico estadístico como un medio informativo y atractivo para impartir alguna información.
Instalación
Como cualquier otra biblioteca de python, seaborn se puede instalar fácilmente usando pip:
pip install seaborn
Esta biblioteca es parte de la distribución de Anaconda y, por lo general, funciona solo con la importación si su IDE es compatible con Anaconda, pero también se puede instalar con el siguiente comando:
conda install seaborn
Gráfico de línea única
Un gráfico de una sola línea presenta datos en el eje xy mediante una línea que une los puntos de datos. Para obtener un gráfico, Seaborn viene con una función incorporada para dibujar un diagrama de líneas llamado lineplot().
Sintaxis: diagrama de líneas (x, y, datos)
dónde,
x – variable de datos para el eje x
y- variable de datos para el eje y
datos- datos a ser trazados
Ejemplo:
Conjunto de datos utilizado: Bestsellers (La trama muestra datos relacionados con las novelas más vendidas de Amazon).
Python3
# import modules import seaborn as sn import matplotlib.pyplot as plt import pandas as pd # import data data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\bestsellers.csv") # selcting required rows and columns data = data.iloc[2:10, :] # plotting a single line graph sn.lineplot(x="Year", y="User Rating", data=data) # displaying the plot plt.show()
Producción:
Configuración de diferentes estilos
También se puede mostrar un diagrama de líneas en un estilo de fondo diferente usando la función set() disponible en el propio módulo seaborn.
Sintaxis:
set()
Atributos:
- Contexto: trazado de parámetros de contexto
- Estilo : define el estilo
- Paleta: establece una paleta de colores
- Fuente
- Font_scale : establece el tamaño de fuente
- Color_codes: si se establece en True, la paleta está activada, las notaciones manuales cortas para los colores se pueden reasignar desde la paleta.
- rc : parámetro para anular los parámetros anteriores
Ejemplo:
Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).
Python
import seaborn as sn import matplotlib.pyplot as plt import pandas as pd data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv") data = data.iloc[2:10, :] sn.lineplot(x="kepid", y="koi_duration", data=data, hue="koi_score") sn.set(style="darkgrid") plt.show()
Producción:
Gráfico de línea múltiple
A veces, las funcionalidades dictan que los datos se comparen entre sí y, para tales casos, se puede dibujar un gráfico múltiple. Un gráfico de líneas múltiples ayuda a diferenciar los datos para que se puedan estudiar y comprender con respecto a otros datos. Cada diagrama de líneas básicamente sigue el concepto de un diagrama de una sola línea, pero difiere en la forma en que se presenta en la pantalla. El gráfico de líneas de cada dato se puede hacer diferente cambiando su color, estilo de línea, tamaño o todos los enumerados, y se puede usar una escala para leerlo.
Para diferenciar en base al color.
diagrama de línea (x, y, datos, tono)
donde, hue decide en base a qué variable se supone que se muestran los datos
Ejemplo:
Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).
Python3
# import modules import seaborn as sn import matplotlib.pyplot as plt import pandas as pd # import data data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv") # select required data data = data.iloc[2:10, :] # plot data with different color scheme sn.lineplot(x="kepid", y="koi_period", data=data, hue="koi_score") # display plot plt.show()
Para diferenciar sobre la base del estilo de línea
diagrama de línea (x, y, datos, estilo)
donde, el estilo decide sobre la base de qué variable se supone que se muestran los datos
Ejemplo:
Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).
Python3
import seaborn as sn import matplotlib.pyplot as plt import pandas as pd data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv") data = data.iloc[2:10, :] # using just style sn.lineplot(x="kepid", y="koi_period", data=data, style="koi_score") plt.show() # using style and hue sn.lineplot(x="kepid", y="koi_period", data=data, hue="koi_score", style="koi_score") plt.show()
Producción:
Para diferenciar en base al tamaño.
diagrama de línea (x, y, datos, tamaño)
donde, el tamaño decide sobre la base de qué variable se supone que se muestran los datos
Ejemplo:
Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).
Python3
import seaborn as sn import matplotlib.pyplot as plt import pandas as pd data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv") data = data.iloc[2:10, :] # using just style sn.lineplot(x="kepid", y="koi_period", data=data, size="koi_score") plt.show() # using style, size and hue sn.lineplot(x="kepid", y="koi_period", data=data, size="koi_score", hue="koi_score", style="koi_score") plt.show()
Producción:
Barras de error en el diagrama de líneas
Las barras de error se utilizan para mostrar las tasas de error en un gráfico de líneas que se puede utilizar para estudiar intervalos en un gráfico. Para esto, se puede emplear el atributo err_style. Esto toma solo dos atributos, ya sea banda o barras.
Sintaxis:
lineplot(x,y,data,err_style)
Ejemplo:
Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).
Python3
import seaborn as sn import matplotlib.pyplot as plt import pandas as pd data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv") data = data.iloc[2:10, :] sn.lineplot(x="kepid", y="koi_duration", data=data, err_style="band") plt.show()
Producción:
Paleta de colores a lo largo del gráfico de líneas
El esquema de color representado por las líneas se puede cambiar usando un atributo de paleta junto con el tono. Se pueden elegir diferentes colores compatibles con la paleta entre: PALETA DE COLORES SEABORN
Sintaxis:
lineplot(x,y,data,hue,palette)
Ejemplo:
Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).
Python3
import seaborn as sn import matplotlib.pyplot as plt import pandas as pd data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv") data = data.iloc[2:10,:] sn.lineplot(x = "kepid", y = "koi_period",data=data, hue="koi_score", palette="pastel") plt.show()
Producción:
Publicación traducida automáticamente
Artículo escrito por vanshikagoyal43 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA