Especificar el nivel del factor de referencia en la regresión lineal en R

En este artículo, discutiremos cómo especificar el nivel del factor de referencia en la regresión lineal en el lenguaje de programación R.

En un modelo de regresión lineal básico en R Language, por defecto, la categoría de referencia 1 se usa para la variable de factor. Pero a veces necesitamos establecer manualmente el nivel del factor de referencia en el modelo de regresión lineal. Para ello utilizamos la función relevel() del lenguaje R. La función relevel() se utiliza para reordenar los niveles de un vector de factores. Los niveles de un vector de factores se reordenan de modo que el nivel especificado por el usuario es el primero y los demás se mueven un paso hacia abajo.

Modelo de regresión lineal con nivel de factor de referencia predeterminado

Para crear un modelo de regresión lineal básico, usamos la función lm() del lenguaje R. La función lm() se usa para ajustar modelos lineales a un marco de datos en el lenguaje R. Se puede utilizar para realizar una regresión lineal para la predicción de datos desconocidos. La función lm() toma el marco de datos y la función de ajuste como argumento y devuelve un modelo de regresión lineal entrenado.

Sintaxis:

lm( función_de_ajuste, datos )

Parámetro:

  • fitting_function: determina la función utilizada para ajustar el marco de datos.
  • datos: determina el marco de datos utilizado en la regresión lineal.

Ejemplo:

Aquí hay un modelo de regresión lineal básico con el nivel de factor de referencia predeterminado.

R

# create sample data frame
x <- sample(1:7, 500, replace = TRUE)
y <- round(x + rnorm(500), 3)
x <- as.factor(x)
sample_data <- data.frame(x, y)
 
# create linear model
linear_model <- lm( y~x, sample_data)
 
# print summary of linear model
summary(linear_model)

Producción:

Aquí, por defecto, el nivel de referencia del factor es x1.

Modelo de regresión lineal con nivel de factor de referencia manual

Para especificar el nivel del factor de referencia manual en el lenguaje R, usaremos la función relevel(). La función relevel() se usa para reordenar el vector de factores de modo que el nivel especificado por el usuario sea el primero y los demás se muevan hacia abajo. La función relevel() toma el vector de factor y el nivel de referencia como argumento y devuelve el vector de factor con niveles reordenados según el nivel de referencia establecido por el usuario.

Sintaxis:

renivelar( factor_vector, ref )

Parámetro:

  • vector_factor: determina el vector factor que se va a reordenar.
  • ref: determina el nivel de referencia según el cual se va a reordenar el factor.

Ejemplo:

Aquí hay un modelo de regresión lineal básico con el nivel de referencia del factor establecido en 4.

R

# create sample data frame
x <- sample(1:7, 500, replace = TRUE)
y <- round(x + rnorm(500), 3)
x <- as.factor(x)
sample_data <- data.frame(x, y)
 
# refactor reference level
sample_data$x <- relevel(sample_data$x, ref = 4)
 
# create linear model
linear_model <- lm( y~x, sample_data)
 
# print summary of linear model
summary(linear_model)

Producción:

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *