Visualización de datos con gráfico de líneas Seaborn

Requisito previo:

La presentación de datos gráficamente para emitir alguna información se conoce como visualización de datos. Básicamente es una imagen para ayudar a una persona a interpretar lo que representan los datos y estudiarlos y su naturaleza en detalle. Tratar con datos a gran escala en filas es una tarea extremadamente tediosa, por lo que la visualización de datos sirve como una alternativa ideal.

Seaborn es una biblioteca de Python que se basa en matplotlib y se utiliza para la visualización de datos. Proporciona un medio para presentar datos en un formato de gráfico estadístico como un medio informativo y atractivo para impartir alguna información.

Instalación

Como cualquier otra biblioteca de python, seaborn se puede instalar fácilmente usando pip:

pip install seaborn

Esta biblioteca es parte de la distribución de Anaconda y, por lo general, funciona solo con la importación si su IDE es compatible con Anaconda, pero también se puede instalar con el siguiente comando:

conda install seaborn

Gráfico de línea única

Un gráfico de una sola línea presenta datos en el eje xy mediante una línea que une los puntos de datos. Para obtener un gráfico, Seaborn viene con una función incorporada para dibujar un diagrama de líneas llamado lineplot(). 

Sintaxis: diagrama de líneas (x, y, datos)

dónde,

x – variable de datos para el eje x

y- variable de datos para el eje y

datos- datos a ser trazados

Ejemplo:

Conjunto de datos utilizado: Bestsellers (La trama muestra datos relacionados con las novelas más vendidas de Amazon).

Python3

# import modules
import seaborn as sn
import matplotlib.pyplot as plt
import pandas as pd
  
# import data
data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\bestsellers.csv")
  
# selcting required rows and columns
data = data.iloc[2:10, :]
  
# plotting a single line graph
sn.lineplot(x="Year", y="User Rating", data=data)
  
# displaying the plot
plt.show()

Producción:

Configuración de diferentes estilos

También se puede mostrar un diagrama de líneas en un estilo de fondo diferente usando la función set() disponible en el propio módulo seaborn.

Sintaxis:

set()

Atributos: 

  • Contexto: trazado de parámetros de contexto
  • Estilo : define el estilo
  • Paleta: establece una paleta de colores
  • Fuente
  • Font_scale : establece el tamaño de fuente
  • Color_codes: si se establece en True, la paleta está activada, las notaciones manuales cortas para los colores se pueden reasignar desde la paleta.
  • rc : parámetro para anular los parámetros anteriores

Ejemplo:

Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).

Python

import seaborn as sn
import matplotlib.pyplot as plt
import pandas as pd
  
data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv")
  
data = data.iloc[2:10, :]
  
sn.lineplot(x="kepid", y="koi_duration", data=data, hue="koi_score")
sn.set(style="darkgrid")
  
plt.show()

Producción:

Gráfico de línea múltiple

A veces, las funcionalidades dictan que los datos se comparen entre sí y, para tales casos, se puede dibujar un gráfico múltiple. Un gráfico de líneas múltiples ayuda a diferenciar los datos para que se puedan estudiar y comprender con respecto a otros datos. Cada diagrama de líneas básicamente sigue el concepto de un diagrama de una sola línea, pero difiere en la forma en que se presenta en la pantalla. El gráfico de líneas de cada dato se puede hacer diferente cambiando su color, estilo de línea, tamaño o todos los enumerados, y se puede usar una escala para leerlo.

Para diferenciar en base al color.

diagrama de línea (x, y, datos, tono)

donde, hue decide en base a qué variable se supone que se muestran los datos

Ejemplo:

Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).

Python3

# import modules
import seaborn as sn
import matplotlib.pyplot as plt
import pandas as pd
  
# import data
data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv")
  
# select required data
data = data.iloc[2:10, :]
  
# plot data with different color scheme
sn.lineplot(x="kepid", y="koi_period", data=data, hue="koi_score")
  
# display plot
plt.show()

Para diferenciar sobre la base del estilo de línea 

diagrama de línea (x, y, datos, estilo)

donde, el estilo decide sobre la base de qué variable se supone que se muestran los datos

Ejemplo:

Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).

Python3

import seaborn as sn
import matplotlib.pyplot as plt
import pandas as pd
  
data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv")
  
data = data.iloc[2:10, :]
  
# using just style
sn.lineplot(x="kepid", y="koi_period", data=data, style="koi_score")
  
plt.show()
  
  
# using style and hue
sn.lineplot(x="kepid", y="koi_period", data=data,
            hue="koi_score", style="koi_score")
  
plt.show()

Producción:

Para diferenciar en base al tamaño.

diagrama de línea (x, y, datos, tamaño)

donde, el tamaño decide sobre la base de qué variable se supone que se muestran los datos

Ejemplo:

Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).

Python3

import seaborn as sn
import matplotlib.pyplot as plt
import pandas as pd
  
data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv")
  
data = data.iloc[2:10, :]
  
# using just style
sn.lineplot(x="kepid", y="koi_period", data=data, size="koi_score")
  
plt.show()
  
  
# using style, size and hue
sn.lineplot(x="kepid", y="koi_period", data=data,
            size="koi_score", hue="koi_score", style="koi_score")
  
plt.show()

Producción:

Barras de error en el diagrama de líneas

Las barras de error se utilizan para mostrar las tasas de error en un gráfico de líneas que se puede utilizar para estudiar intervalos en un gráfico. Para esto, se puede emplear el atributo err_style. Esto toma solo dos atributos, ya sea banda o barras.

Sintaxis:

lineplot(x,y,data,err_style)

Ejemplo:

Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).

Python3

import seaborn as sn
import matplotlib.pyplot as plt
import pandas as pd
  
data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv")
  
data = data.iloc[2:10, :]
  
sn.lineplot(x="kepid", y="koi_duration", data=data, err_style="band")
  
plt.show()

Producción:

Paleta de colores a lo largo del gráfico de líneas

El esquema de color representado por las líneas se puede cambiar usando un atributo de paleta junto con el tono. Se pueden elegir diferentes colores compatibles con la paleta entre: PALETA DE COLORES SEABORN

Sintaxis:

lineplot(x,y,data,hue,palette)

Ejemplo:

Conjunto de datos utilizado: acumulativo (los datos muestran un conjunto de datos de investigación espacial de exoplanetas compilado por la NASA).

Python3

import seaborn as sn
import matplotlib.pyplot as plt
import pandas as pd
  
data = pd.read_csv("C:\\Users\\Vanshi\\Desktop\\gfg\\cumulative.csv")
  
data = data.iloc[2:10,:]
  
sn.lineplot(x = "kepid", y = "koi_period",data=data, hue="koi_score", palette="pastel")
  
plt.show()

Producción:

Publicación traducida automáticamente

Artículo escrito por vanshikagoyal43 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *