El coeficiente de determinación se define como la fracción de varianza predicha por la variable independiente en la variable dependiente. Muestra el grado de variación en la recopilación de datos ofrecidos. También se conoce como R 2método que se utiliza para examinar cómo las diferencias en una variable pueden ser explicadas por variaciones en otra. Se utiliza en el análisis estadístico para predecir y explicar los eventos futuros de un modelo. Es proporcional al cuadrado de la correlación y su valor se encuentra entre 0 y 1. Si su valor es cero, la variable dependiente no se puede predecir a partir de la variable independiente. Si es 1, la variable dependiente se puede predecir sin error a partir de la variable independiente. Y si está entre 0 y 1, refleja qué tan bien se puede predecir la variable dependiente. Su valor es igual al cuadrado del coeficiente de correlación, es decir, r 2 .
Fórmula
dónde,
r 2 es el coeficiente de determinación,
n es el número de observaciones del conjunto de datos,
Σx es la suma de la primera variable,
Σy es la suma de la segunda variable,
Σxy es la suma del producto de la primera y la segunda variable,
Σx 2 es la suma de los cuadrados de la primera variable,
Σy 2 es la suma de los cuadrados de la segunda variable.
Si se dan la suma residual de los cuadrados y la suma total de los cuadrados de los valores de los datos, la fórmula para el coeficiente de determinación está dada por,
r2 = 1 – (R/T )
dónde,
r 2 es el coeficiente de determinación,
R es la suma residual de cuadrados,
T es la suma total de cuadrados.
Problemas de muestra
Problema 1. Calcular el coeficiente de determinación para los datos:
X |
y |
1 |
4 |
4 |
8 |
6 |
9 |
8 |
10 |
Solución:
El conjunto de datos dado es,
X
y
xy
x2 _
2 años
1
4
4
1
dieciséis
4
8
12
dieciséis
64
6
9
15
36
81
8
10
18
64
100
x = 19
Σy = 31
Σxy = 49
x2 = 117
Σy2 = 261
Usando la fórmula que obtenemos,
r 2 = [ (4 (49) – (19) (31)) / ((4 (117) – 361) (4 (261) – 961)) ] 2
= (-393/8881) 2
= (-0.044) 2
= 0.001936
Problema 2. Calcular el coeficiente de determinación para los datos:
X |
y |
5 |
3 |
2 |
8 |
4 |
1 |
7 |
5 |
El conjunto de datos dado es,
X
y
xy
x2 _
2 años
5
3
15
25
9
2
8
dieciséis
4
64
4
1
4
dieciséis
1
7
5
35
49
25
x = 18
Σy = 17
Σxy = 70
x2 = 94
Σy 2 = 99
Usando la fórmula que obtenemos,
r 2 = [ (4 (70) – (18) (17)) / ((4 (94) – 324) (4 (99) – 289)) ] 2
= (-26/5564) 2
= (-0.046)2
= 0.002116
Problema 3. Calcular el coeficiente de determinación si el coeficiente de correlación es 0,5.
Solución:
Tenemos,
r = 0,5
Usando la fórmula que obtenemos,
Coeficiente de determinación = r 2
= (0.5) 2
= 0,25
Problema 4. Calcular el coeficiente de determinación si el coeficiente de correlación es 0,82.
Solución:
Tenemos,
r = 0,82
Usando la fórmula que obtenemos,
Coeficiente de determinación = r 2
= (0.82) 2
= 0,67
Problema 5. Calcular el coeficiente de correlación si el coeficiente de determinación es 0,54.
Solución:
Tenemos,
r2 = 0,54
Usando la fórmula que obtenemos,
Coeficiente de correlación = √r 2
= √0.54
= 0,734
Problema 6. Calcular el coeficiente de correlación si el coeficiente de determinación es 0,68.
Solución:
Tenemos,
r2 = 0,68
Usando la fórmula que obtenemos,
Coeficiente de correlación = √r 2
= √0.68
= 0,82
Problema 7. Calcular el coeficiente de determinación si la suma de cuadrados residual es 100 y la suma de cuadrados total es 200.
Solución:
Tenemos,
R = 100
T = 200
Usando la fórmula que obtenemos,
r2 = 1 – (R/T )
= 1 – (100/200)
= 1 – 1/2
= 1/2
= 0,5