Trazado de múltiples series de tiempo en el mismo gráfico usando ggplot en R

Los datos de series temporales son datos jerárquicos. Es una serie de datos asociados a una marca de tiempo. Un ejemplo de una serie de tiempo son los precios del oro durante un período o rango de temperatura o precipitación durante las tormentas anuales. Para visualizar estos datos, R proporciona una biblioteca útil llamada ggplot . Usando ggplot, podemos ver todo tipo de gráficos. Junto con ggplot, R también proporciona bibliotecas para limpiar datos y transformarlos o manipularlos para que se ajusten a nuestros requisitos de visualización.

Este artículo analizará un conjunto de datos de los conjuntos de datos R y un conjunto de datos obtenido de un archivo CSV.

Conjunto de datos 1: muertes por Covid en la UE para marzo de 2020

El conjunto de datos nos brinda los recuentos diarios de muertes por Covid-19 para todos los países europeos para marzo de 2020. Trazaremos la cantidad de muertes (eje y) frente al día (eje x) para cada país.

Los datos en uso se pueden descargar desde aquí .

Parcela 1: Recuento diario de muertes

Los pasos para el trazado son los siguientes:

  • Abra R Studio y abra un cuaderno R (tiene más opciones).
  • Guarde este archivo como .rmd, preferiblemente en la misma carpeta que sus datos.
  • Seleccione el directorio de trabajo donde están sus datos
  • Importar todas las bibliotecas R
  • Lea los datos del CSV.
  • Los datos anteriores se distribuyen en columnas. Para facilitar el trazado, necesitamos formatear los datos en el formato requerido.
  • Trazar datos
  • Mostrar datos

Ejemplo:

R

library(ggplot2)
library(reshape2)
library(dplyr)
 
covid1 =(read.csv(file="EUCOVIDdeaths.csv",header=TRUE)[,-c(2)])
 
head(covid1)
 
 
covid_deaths <- melt(covid1,id.vars=c("Country"),value.name="value",
                     variable.name="Day")
 
head(covid_deaths)
 
covid_plot <- ggplot(data=covid_deaths, aes(x=Day, y=value, group = Country,
                                            colour = Country))
+ geom_line() +labs(y= "Deaths", x = "Day")
covid_plot + ggtitle("Daily Deaths for European countries in March,2020")+geom_point()
 
covid_plot

Producción:

Trama de series de tiempo de muertes diarias con puntos

Gráfico 2: Trazado de muertes por covid per cápita.

Usaremos los mismos datos que en el ejemplo anterior. Pero aquí nos ocuparemos de los datos per cápita.

R

library(ggplot2)
library(reshape2)
library(dplyr)
 
covid1 =(read.csv(file="EUCOVIDdeaths.csv",header=TRUE)[,-c(2)])
 
head(covid1)
 
covid_perCapita <- covid1[,c(2:17)] / covid$PopulationM
 
covid_perCapita$Country <- covid1$Country
 
head(covid_perCapita)
 
covid_perCapita_deaths <- melt(covid_perCapita,id.vars=c("Country"),
                               value.name="value", variable.name="Day")
 
covidPerCapitaPlot <- ggplot(data=covid_perCapita_deaths,
   aes(x=Day, y=value, group = Country, colour = Country)) + geom_line()
   +labs(y= "Deaths per Capita", x = "Day")  + theme_bw(base_size = 16)
+ theme(axis.text.x=element_text(angle=60,hjust=1))
+ ggtitle("Day-wise Covid-Deaths per Capita in Europe in 2020")
 
covid_perCapitaPlot

Producción:

Parcela capita

Conjunto de datos 2: lluvia para los condados de EE. UU. durante las tormentas tropicales.

Primero instale el paquete: Hurricaneexposuredata

Antes de instalar el paquete, verifique la versión R. Para verificar la versión R en RStudio, vaya a Herramientas -> Opciones globales. En la ventana que se abre, en la pestaña Básico, vemos la versión R.  

#Si la versión R es mayor a 4  

install.packages(“datos de exposición a huracanes”)

#Para versiones de R inferiores a 4.0, instale de esta manera

install.packages(‘datos expuestos a huracanes’, repos=’https://geanders.github.io/drat/’, type=’source’)

Ejemplo:

R

library(hurricaneexposuredata)
library(hurricaneexposure)
 
rain_data <- county_rain(counties = c("01001","36005", "36047",
                                      "36061","36085", "36081",
                                      "36119","22071", "51700"),
              start_year = 1995, end_year = 2005, rain_limit = 50,
                         dist_limit = 500, days_included = c(-1, 0, 1))
 
ggplot(data = rain_data, aes(x=fips, y=tot_precip, group=storm_id,
                             color=storm_id)) + geom_line()

Producción:

Publicación traducida automáticamente

Artículo escrito por reshmasathe y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *