Los datos de series temporales son datos jerárquicos. Es una serie de datos asociados a una marca de tiempo. Un ejemplo de una serie de tiempo son los precios del oro durante un período o rango de temperatura o precipitación durante las tormentas anuales. Para visualizar estos datos, R proporciona una biblioteca útil llamada ggplot . Usando ggplot, podemos ver todo tipo de gráficos. Junto con ggplot, R también proporciona bibliotecas para limpiar datos y transformarlos o manipularlos para que se ajusten a nuestros requisitos de visualización.
Este artículo analizará un conjunto de datos de los conjuntos de datos R y un conjunto de datos obtenido de un archivo CSV.
Conjunto de datos 1: muertes por Covid en la UE para marzo de 2020
El conjunto de datos nos brinda los recuentos diarios de muertes por Covid-19 para todos los países europeos para marzo de 2020. Trazaremos la cantidad de muertes (eje y) frente al día (eje x) para cada país.
Los datos en uso se pueden descargar desde aquí .
Parcela 1: Recuento diario de muertes
Los pasos para el trazado son los siguientes:
- Abra R Studio y abra un cuaderno R (tiene más opciones).
- Guarde este archivo como .rmd, preferiblemente en la misma carpeta que sus datos.
- Seleccione el directorio de trabajo donde están sus datos
- Importar todas las bibliotecas R
- Lea los datos del CSV.
- Los datos anteriores se distribuyen en columnas. Para facilitar el trazado, necesitamos formatear los datos en el formato requerido.
- Trazar datos
- Mostrar datos
Ejemplo:
R
library(ggplot2) library(reshape2) library(dplyr) covid1 =(read.csv(file="EUCOVIDdeaths.csv",header=TRUE)[,-c(2)]) head(covid1) covid_deaths <- melt(covid1,id.vars=c("Country"),value.name="value", variable.name="Day") head(covid_deaths) covid_plot <- ggplot(data=covid_deaths, aes(x=Day, y=value, group = Country, colour = Country)) + geom_line() +labs(y= "Deaths", x = "Day") covid_plot + ggtitle("Daily Deaths for European countries in March,2020")+geom_point() covid_plot
Producción:
Gráfico 2: Trazado de muertes por covid per cápita.
Usaremos los mismos datos que en el ejemplo anterior. Pero aquí nos ocuparemos de los datos per cápita.
R
library(ggplot2) library(reshape2) library(dplyr) covid1 =(read.csv(file="EUCOVIDdeaths.csv",header=TRUE)[,-c(2)]) head(covid1) covid_perCapita <- covid1[,c(2:17)] / covid$PopulationM covid_perCapita$Country <- covid1$Country head(covid_perCapita) covid_perCapita_deaths <- melt(covid_perCapita,id.vars=c("Country"), value.name="value", variable.name="Day") covidPerCapitaPlot <- ggplot(data=covid_perCapita_deaths, aes(x=Day, y=value, group = Country, colour = Country)) + geom_line() +labs(y= "Deaths per Capita", x = "Day") + theme_bw(base_size = 16) + theme(axis.text.x=element_text(angle=60,hjust=1)) + ggtitle("Day-wise Covid-Deaths per Capita in Europe in 2020") covid_perCapitaPlot
Producción:
Conjunto de datos 2: lluvia para los condados de EE. UU. durante las tormentas tropicales.
Primero instale el paquete: Hurricaneexposuredata
Antes de instalar el paquete, verifique la versión R. Para verificar la versión R en RStudio, vaya a Herramientas -> Opciones globales. En la ventana que se abre, en la pestaña Básico, vemos la versión R.
#Si la versión R es mayor a 4
install.packages(“datos de exposición a huracanes”)
#Para versiones de R inferiores a 4.0, instale de esta manera
install.packages(‘datos expuestos a huracanes’, repos=’https://geanders.github.io/drat/’, type=’source’)
Ejemplo:
R
library(hurricaneexposuredata) library(hurricaneexposure) rain_data <- county_rain(counties = c("01001","36005", "36047", "36061","36085", "36081", "36119","22071", "51700"), start_year = 1995, end_year = 2005, rain_limit = 50, dist_limit = 500, days_included = c(-1, 0, 1)) ggplot(data = rain_data, aes(x=fips, y=tot_precip, group=storm_id, color=storm_id)) + geom_line()
Producción:
Publicación traducida automáticamente
Artículo escrito por reshmasathe y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA