Insertar filas para fechas faltantes en R DataFrame

En este artículo, vamos a ver cómo insertar filas para fechas faltantes en el lenguaje de programación R.

El paquete padr en R se usa para hacer preparaciones de datos de series de tiempo usando la función pad(). El paquete se puede descargar e instalar en el espacio de trabajo usando el siguiente comando:

install.packages(“padr”)

El método pad en R se usa para realizar el relleno de fecha. Se utiliza para rellenar todas las observaciones entre el primer y el último valor obtenido del marco de datos. Él mismo determina cuál es la variable de fecha y hora en el marco de datos, evaluando así su intervalo. Realiza una inserción para cada punto de tiempo que falta en el conjunto de datos dentro del intervalo. NA o los valores faltantes se insertan en el marco de datos para todas las filas de variables que no son de fecha y hora en el marco de datos.

pad(data-frame)

Ejemplo 1:

R

library("padr")
  
# creating data frame
data_frame <- data.frame(col1 = as.Date(c("2021-08-02", 
                                    "2021-08-04",
                                    "2021-08-09",
                                    "2021-08-10")),
                   col2 = letters[1:4])
print("Data Frame")
print(data_frame)
  
# modified data
data_frame_mod <- pad(data_frame)
print(data_frame_mod)

Producción:

El siguiente fragmento de código no agrega ninguna fila en el marco de datos ya que todas las fechas correspondientes se encuentran dentro del mismo intervalo de tiempo, es decir, un período de 3 días. Esta información se muestra en la consola mientras se usa el método pad().

Ejemplo 2:

R

library("padr")
  
# creating data frame
data_frame <- data.frame(col1 = as.Date(c("2021-10-29", 
                                    "2021-11-01",
                                    "2021-11-04"
                                    )),
                   col2 = letters[1:3])
print("Data Frame")
print(data_frame)
  
# modified data
data_frame_mod <- pad(data_frame)
print(data_frame_mod)

Producción:

Además, el método pad() se puede personalizar para agregar los intervalos usando ‘horas’ o ‘mins’ y especificando los valores de intervalo inicial y final usando los argumentos start_val y end_val respectivamente. Los valores que faltan luego se agregan en los intervalos especificados.

pad( 'hour' , start_val = , end_val = )

Publicación traducida automáticamente

Artículo escrito por mallikagupta90 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *