Cómo crear un gráfico residual en R

En este artículo, veremos un procedimiento paso a paso para crear una gráfica residual en el lenguaje de programación R.

Las gráficas de residuos se utilizan a menudo para evaluar si los residuos en el análisis de regresión se distribuyen normalmente o no y si exhiben o no heteroscedasticidad.

Vamos a crear una trama residual en el lenguaje de programación R.

Paso 1: ajuste el modelo de regresión

En este paso, ajustaremos un modelo de regresión usando el conjunto de datos del iris, que es el conjunto de datos incorporado de rstudio como variable de respuesta y Sepal.Length y Sepal.Width como variables explicativas usando la función lm()) y luego más llamar a la función resid() pasó este modelo de regresión para obtener la lista de residuos del modelo.

R

# load the dataset
data("iris")
  
# select Target attribute and 
# Predictor attribute
Y<- iris[,"Sepal.Width"] 
X<- iris[,"Sepal.Length"]
  
# fit a regression model
model <- lm(Y~X)
  
# get list of residuals 
res <- resid(model)
res

Producción:

 

Paso 2: Producir gráfico residual vs. ajustado

En este paso, estamos trazando un gráfico de dispersión del residual del modelo modal frente al filtrado para detectar visualmente la heteroscedasticidad, por ejemplo, un cambio sistemático en la dispersión de los residuales en un rango de valores. 

R

# produce residual vs. fitted plot
plot(fitted(model), res)
  
# add a horizontal line at 0 
abline(0,0)

Producción:

 

Paso 3: producir un gráfico QQ

Aquí, estamos trazando un gráfico QQ usando la función qqnorm(), para determinar si los residuos siguen una distribución normal. Si los valores de los datos en el gráfico caen a lo largo de una línea recta en un ángulo de 45 grados usando la función qqline() pasada con los parámetros requeridos, entonces los datos se distribuyen normalmente. Y en la salida, los residuos tienden a desviarse bastante de la línea cerca de las colas, lo que indica que no están distribuidos normalmente.

R

# create Q-Q plot for residuals
qqnorm(res)
  
# add a straight diagonal line 
# to the plot
qqline(res)

Producción:

 

Paso 4:

En este paso, trazamos diagramas de densidad para verificar visualmente si los residuos se distribuyen normalmente o no. Si el gráfico tiene una forma de campana aproximada, es probable que los residuos sigan una distribución normal y, en comparación con la salida, el gráfico de densidad sigue aproximadamente una forma de campana, lo que garantiza que los residuos tengan una distribución más normal.

R

plot(density(res))

Producción:

 

Publicación traducida automáticamente

Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *