R-cuadrado es una medida estadística que representa la bondad de ajuste de un modelo de regresión. El valor ideal para r-cuadrado es 1. Cuanto más se acerque el valor de r-cuadrado a 1, mejor se ajustará el modelo.
R-cuadrado es una comparación de la suma residual de cuadrados (SS res ) con la suma total de cuadrados (SS tot ) . La suma total de cuadrados se calcula mediante la suma de cuadrados de la distancia perpendicular entre los puntos de datos y la línea promedio.
La suma residual de cuadrados se calcula sumando los cuadrados de la distancia perpendicular entre los puntos de datos y la línea de mejor ajuste.
R cuadrado se calcula utilizando la siguiente fórmula:
Donde SS res es la suma residual de cuadrados y SS tot es la suma total de cuadrados.
La bondad de ajuste de los modelos de regresión se puede analizar sobre la base del método R-cuadrado. Cuanto más cerca de 1 esté el valor de r-cuadrado, mejor será el modelo.
Nota: El valor de R-cuadrado también puede ser negativo cuando el modelo ajustado es peor que el modelo ajustado promedio.
Limitación del uso del método R-cuadrado –
- El valor de r-cuadrado siempre aumenta o permanece igual a medida que se agregan nuevas variables al modelo, sin detectar la importancia de esta variable recién agregada (es decir, el valor de r-cuadrado nunca disminuye con la adición de nuevos atributos al modelo). Como resultado, los atributos no significativos también se pueden agregar al modelo con un aumento en el valor de r-cuadrado.
- Esto se debe a que SS tot siempre es constante y el modelo de regresión intenta disminuir el valor de SS res al encontrar alguna correlación con este nuevo atributo, por lo tanto, el valor general de r-square aumenta, lo que puede conducir a un modelo de regresión deficiente.
Publicación traducida automáticamente
Artículo escrito por deepak_jain y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA