Los coeficientes de correlación se utilizan para medir qué tan fuerte es una relación entre dos variables. Existen diferentes tipos de fórmulas para obtener el coeficiente de correlación, una de las más populares es la correlación de Pearson (también conocida como R de Pearson), que se usa comúnmente para la regresión lineal. El coeficiente de correlación de Pearson se denota con el símbolo “R”. La fórmula del coeficiente de correlación devuelve un valor entre 1 y -1. Aquí,
- 1 indica fuertes relaciones positivas
- -1 indica fuertes relaciones negativas
- Y un resultado de cero indica que no hay ninguna relación
Fórmula del coeficiente de correlación lineal
El coeficiente de correlación lineal se conoce como r de Pearson o coeficiente de correlación de Pearson. Lo cual refleja la dirección y la fuerza de la relación lineal entre las dos variables x e y. Devuelve un valor entre -1 y +1. En este -1 indica una fuerte correlación negativa y +1 indica una fuerte correlación positiva. Si es 0 entonces no hay correlación. Esto también se conoce como correlación cero.
Las «estimaciones brutas» para interpretar las fortalezas de las correlaciones utilizando la Correlación de Pearson:
valor r | estimaciones crudas |
+.70 o superior | Una relación positiva muy fuerte. |
+.40 a +.69 | Fuerte relación positiva |
+.30 a +.39 | Relación positiva moderada |
+.20 a +.29 | relación positiva débil |
+.01 a +.19 | Relación nula o insignificante |
0 | Sin relación [correlación cero] |
-.01 a -.19 | Relación nula o insignificante |
-.20 a -.29 | relación negativa débil |
-.30 a -.39 | Relación negativa moderada |
-.40 a -.69 | Fuerte relación negativa |
-.70 o superior | La relación negativa muy fuerte |
La fórmula utilizada para obtener el coeficiente de correlación lineal de los datos es:
R = n(∑xy) – (∑x)(∑y) / √[n∑x²-(∑x)²][n∑y²-(∑y)²
Explique los tipos de coeficientes de correlación lineal.
El coeficiente de correlación lineal se refleja en la r de Pearson. Entonces, el valor de r puede oscilar entre +1 y -1.
Hay tres tipos de coeficiente de correlación lineal de la siguiente manera:
Los valores positivos indican una Correlación Positiva (0<r1)
Los valores negativos indican una Correlación Negativa (-1r<1)
Un valor de 0 indica que no hay correlación (r=0)
Correlación positiva: en correlación positiva, ambas variables se mueven en la misma dirección. Si uno aumenta el otro también aumenta y si uno disminuye el otro también disminuye. Siempre que la r indica un valor positivo muestra una relación positiva
Correlación negativa: en correlación negativa, ambas variables se mueven en diferentes direcciones. Si uno aumenta el otro disminuye y si uno disminuye el otro aumenta. Siempre que la r indica un valor negativo, muestra una relación negativa
No correlación: cuando no existe asociación estadística entre las variables. Se dice que no tienen correlación. En este caso, su coeficiente de correlación (también conocido como r) es 0.
Problemas de muestra
Problema 1: Calcular el coeficiente de correlación para los siguientes datos:
X = 5, 9, 14, 16
y
Y = 6, 10, 16, 20
Solución:
Las variables dadas son,
X = 12,16 ,4, 8
y
Y = 15, 20, 55, 10
Para encontrar el coeficiente de correlación de las siguientes variables, primero se debe construir una tabla de la siguiente manera, para obtener los valores requeridos en la fórmula, también agregue todos los valores en las columnas para obtener los valores utilizados en la fórmula.
X Y XY X² Y² 5 6 180 144 225 9 10 320 256 400 14 dieciséis 20 dieciséis 20 dieciséis 20 80 56 100 ∑40 ∑50 ∑600 ∑480 ∑750 ∑xy = 600
∑x = 40
∑y = 50
∑x² = 470
∑y² = 750
norte = 4
Ponga todos los valores en la fórmula del coeficiente de correlación de Pearson: –
R = n(∑xy) – (∑x)(∑y) / √[n∑x²-(∑x)²][n∑y²-(∑y)²
R = 4(600) – (40)(50) / √[4(470)-(40)²][4(750)-(50)²]
R = 400 / √[320][500]
R = 400/400
R = 1
Muestra que la relación entre las variables de los datos es una relación positiva muy fuerte.
Problema 2: Encuentra el valor del coeficiente de correlación de la siguiente tabla:
TEMA | EDAD X | NIVEL DE GLUCOSA Y |
1 | 42 | 98 |
2 | 23 | 68 |
3 | 22 | 73 |
4 | 47 | 79 |
5 | 50 | 88 |
6 | 60 | 82 |
Solución:
Haz una tabla a partir de los datos dados y agrega tres columnas más de XY, X² e Y² y también suma todos los valores en las columnas para obtener ∑xy, ∑x, ∑y, ∑x² y ∑y² y n =6.
TEMA EDAD X GLUCOSA
NIVEL Y
XY X² Y² 1 42 98 4116 1764 9604 2 23 68 1564 529 4624 3 22 73 1606 484 5329 4 47 79 3713 2209 6241 5 50 88 4400 2500 7744 6 60 82 4980 3600 6724 ∑ 244 488 20379 11086 40266 ∑xy= 20379
∑x=244
∑y=488
∑x² =11086
∑y² =40266
n = 6.
Ponga todos los valores en la fórmula del coeficiente de correlación de Pearson: –
R = n(∑xy) – (∑x)(∑y) / √ [n∑x²-(∑x)²][n∑y²-(∑y)²
R = 6(20379) – (244)(488) / √ [6(11086)-(244)²][6(40266)-(488)²
R = 3202 / √ [6980][3452]
R = 3202/4972.238
R = 0,6439
Muestra que la relación entre las variables de los datos es una fuerte relación positiva.
Problema 3: Calcular el coeficiente de correlación para los siguientes datos:
X = 21,31,25,40,47,38
y
Y = 70,55,60,78,66,80
Solución:
Las variables dadas son,
X = 21,31,25,40,47,38
y
Y = 70,55,60,78,66,80
Para encontrar el coeficiente de correlación de las siguientes variables, primero se debe construir una tabla de la siguiente manera, para obtener los valores requeridos en la fórmula, también agregue todos los valores en las columnas para obtener los valores utilizados en la fórmula.
X Y XY X² Y² 21 70 1470 441 4900 31 55 1705 961 3025 25 60 1400 625 3600 40 78 3120 1600 6084 47 66 3102 2209 4356 38 80 3040 1444 6400 ∑202 ∑409 ∑13937 ∑7280 ∑28265 ∑xy= 13937
∑x=202
∑y=409
∑x² =7280
∑y² =28265
norte = 6
Ponga todos los valores en la fórmula del coeficiente de correlación de Pearson: –
R= n(∑xy) – (∑x)(∑y) / √ [n∑x²-(∑x)²][n∑y²-(∑y)²
R= 6(13937) – (202)(409) / √ [6(7280)-(202)²][6(28265)-(409)²]
R= 1004 / √[2876][2909]
R=1004 / 2892.452938
R=-0.3471
Se muestra que la relación entre las variables de los datos es una relación positiva moderada.
Problema 4: Calcular el coeficiente de correlación para los siguientes datos:
X= 12, 10, 42, 27,35,56
y
Y = 13, 15, 56, 34,65,26
Solución:
Las variables dadas son,
X= 12, 10, 42, 27,35,56
y
Y = 13, 15, 56, 34,65,26
Para encontrar el coeficiente de correlación de las siguientes variables, primero se debe construir una tabla de la siguiente manera, para obtener los valores requeridos en la fórmula, también agregue todos los valores en las columnas para obtener los valores utilizados en la fórmula.
X Y XY X² Y² 12 13 156 144 169 10 15 150 100 225 42 56 2353 1764 3136 27 34 918 729 1156 35 sesenta y cinco 2275 1225 4225 56 26 1456 3136 676 ∑182 ∑209 ∑7307 ∑7098 ∑9587 ∑xy= 7307
∑x=182
∑y=209
∑x² =7098
∑y² =9587
norte = 6
Ponga todos los valores en la fórmula del coeficiente de correlación de Pearson: –
R= n(∑xy) – (∑x)(∑y) / √ [n∑x²-(∑x)²][n∑y²-(∑y)²
R= 6(7307) – (182)(209) / √ [6(7098)-(182)²][6(9587)-(209)²]
R= 5804 / √[9464][13841]
R= 5804/11445.139
R=0,5071
Muestra que la relación entre las variables de los datos es una fuerte relación positiva.
Problema 5: ¿Hay algún coeficiente de correlación que se haya dado para saber si las variables son positivas o negativas?
0,69
0.42
-0.23
-0.99
Solución:
El coeficiente de correlación dado es el siguiente:
0,64
0.46
-0.29
-0.95
Di si la relación es negativa o positiva.
0,64
La relación entre las variables es una fuerte relación positiva
0.46
La relación entre las variables es una fuerte relación positiva
-0.29
La relación entre las variables es una relación negativa débil.
-0.95
La relación entre las variables es una relación negativa muy fuerte.
Problema 6: Calcular el coeficiente de correlación para los siguientes datos:
x = 10, 13, 15, 17, 19
y
Y = 5,10,15,20,25.
Solución:
Las variables dadas son,
x = 10, 13, 15, 17, 19
y
Y = 5,10,15,20,25.
Para encontrar el coeficiente de correlación de las siguientes variables, primero se debe construir una tabla de la siguiente manera, para obtener los valores requeridos en la fórmula, también agregue todos los valores en las columnas para obtener los valores utilizados en la fórmula.
X Y XY X² Y² 10 5 50 100 25 13 10 130 169 100 15 15 225 225 225 17 20 340 289 400 19 25 475 361 625 ∑74 ∑75 ∑1103 ∑1144 ∑1375 ∑xy= 1103
∑x=74
∑y=75
∑x² =1144
∑y² =1375
norte = 5
Ponga todos los valores en la fórmula del coeficiente de correlación de Pearson: –
R= n(∑xy) – (∑x)(∑y) / √ [n∑x²-(∑x)²][n∑y²-(∑y)²
R= 5(1103) – (74)(75) / √ [5(1144)-(74)²][5(1375)-(75)²]
R= -35 / √[244][1250]
R= -35/552,26
R=0,0633
Muestra que la relación entre las variables de los datos es una relación despreciable.
Problema 7: Encuentra el valor del coeficiente de correlación de la siguiente tabla:
TEMA | EDAD X | Peso Y |
1 | 40 | 99 |
2 | 25 | 79 |
3 | 22 | 69 |
4 | 54 | 89 |
Solución:
TEMA EDAD X Peso Y XY X² Y² 1 40 99 3960 1600 9801 2 25 79 1975 625 6241 3 22 69 1518 484 4761 4 54 89 4806 2916 7921 ∑ 151 336 12259 5625 28724 ∑xy= 12258
∑x=151
∑y=336
∑x² =5625
∑y² 28724
norte = 4
Ponga todos los valores en la fórmula del coeficiente de correlación de Pearson: –
R= n(∑xy) – (∑x)(∑y) / √ [n∑x²-(∑x)²][n∑y²-(∑y)²
R= 4(12258) – (151)(336) / √ [4(5625)-(151)²][4(28724)-(336)²]
R= -1704 / √ [-301][-2000]
R=-1704/775.886
R=-2.1961
Muestra que la relación entre las variables de los datos es una relación negativa muy fuerte.
Publicación traducida automáticamente
Artículo escrito por chhabradhanvi y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA