¿Cómo interpretar los códigos de significado en R?

En este artículo, discutiremos cómo interpretar los códigos de significado en el lenguaje de programación R. 

Los códigos de significación indican qué tan seguros podemos estar de que el siguiente coeficiente tendrá un impacto en la variable dependiente. Esto nos ayuda a determinar los componentes principales que afectan la variación de nuestra variable objetivo. Para calcular los códigos de significado para un modelo de regresión en lenguaje R, usamos la función summary(). La función summary() resume los ajustes del modelo lineal utilizando medidas estadísticas para cada componente. 

Sintaxis:

resumen (modelo_de_regresión)

Parámetro:

Regression_ model: determina el modelo cuyo resumen debemos encontrar.

El código de significancia en el resumen de un modelo de regresión es una medida de su variación del valor p. La siguiente tabla muestra el rango de valor p para cada código de significado.

Códigos de significado valor p
*** [0, 0,001]
** (0.001, 0.01]
* (0.01, 0.05]
. (0.05, 0.1]
  (0.1, 1] 

Aquí, cuanto menor sea el valor p de una variable, más significativo será para ese modelo. Por ejemplo, si var1 tiene un código de significado ** y var2 tiene un significado *, significa que var1 es más significativo que var2 para ese modelo de regresión, ya que tiene un valor p más pequeño.

Ejemplo: Códigos de significados para un modelo lineal.

R

# load library tidyverse
library(tidyverse)
  
# fit regression model 
linear_model <- lm(price ~ carat + depth + table,
                   data = diamonds)
  
# view model summary
summary(linear_model)

Producción:

Llamar:

lm(fórmula = precio ~ quilate + profundidad + tabla, datos = diamantes)

Derechos residuales de autor:

    Mín. 1T Mediana 3T Máx.  

-18288.0 -785.9 -33.2 527.2 12486.7  

Coeficientes:

            Estimación estándar Error valor t Pr(>|t|)    

(Intercepción) 13003.441 390.918 33.26 <2e-16 ***

quilate 7858.771 14.151 555.36 <2e-16 ***

profundidad -151.236 4.820 -31.38 <2e-16 ***

tabla -104.473 3.141 -33.26 <2e-16 ***

signif. códigos: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ‘ 1

Error estándar residual: 1526 en 53936 grados de libertad

R-cuadrado múltiple: 0,8537, R-cuadrado ajustado: 0,8537  

Estadístico F: 1.049e+05 en 3 y 53936 DF, valor p: < 2.2e-16

Ejemplo: Códigos de significación para un modelo ANOVA unidireccional. 

R

# load library tidyverse
library(tidyverse)
  
# fit anova model 
anova_model <- aov(price~carat, data = diamonds)
  
# view model summary
summary(anova_model)

Producción:

               Valor Df Sum Sq Media Sq F Pr(>F)    

quilate 1 7.291e+11 7.291e+11 304051 <2e-16 ***

Residuos 53938 1.293e+11 2.398e+06                    

signif. códigos: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ‘ 1

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *