¿Qué es la prueba de correlación?
La fuerza de la asociación entre dos variables se conoce como prueba de correlación. Por ejemplo, si estamos interesados en saber si existe una relación entre las estaturas de padres e hijos, se puede calcular un coeficiente de correlación para responder a esta pregunta.
Para obtener más información sobre la correlación, consulte esto.
Métodos para el análisis de correlación:
Existen principalmente dos tipos de correlación:
- Correlación Paramétrica – Correlación de Pearson(r): Mide una dependencia lineal entre dos variables (x e y) se conoce como prueba de correlación paramétrica porque depende de la distribución de los datos.
- Correlación no paramétrica: Kendall (tau) y Spearman (rho) : son coeficientes de correlación basados en rangos, se conocen como correlación no paramétrica.
Fórmula del coeficiente de correlación de rango de Kendall:
dónde,
- Par Concordante: Un par de observaciones (x1, y1) y (x2, y2) que sigue la propiedad
- x1 > x2 y y1 > y2 o
- x1 < x2 y y1 < y2
- Par Discordante: Un par de observaciones (x1, y1) y (x2, y2) que sigue la propiedad
- x1 > x2 y y1 < y2 o
- x1 < x2 y y1 > y2
- n: Número total de muestras
Nota: El par para el cual x1 = x2 e y1 = y2 no se clasifican como concordantes o discordantes y se ignoran.
Ejemplo: Consideremos la clasificación de dos expertos en alimentos en la siguiente tabla.
Elementos | Experto 1 | Experto 2 |
---|---|---|
1 | 1 | 1 |
2 | 2 | 3 |
3 | 3 | 6 |
4 | 4 | 2 |
5 | 5 | 7 |
6 | 6 | 4 |
7 | 7 | 5 |
La tabla dice que para el elemento 1, el experto 1 da el rango 1, mientras que el experto 2 también da el rango 1. De manera similar, para el elemento 2, el experto 1 otorga el rango 2, mientras que el experto 2 otorga el rango 3 y así sucesivamente.
Paso 1:
Primero, según la fórmula, tenemos que encontrar el número de pares concordantes y el número de pares discordantes. Así que eche un vistazo a las filas del artículo 1 y el artículo 2. Sea experto-1, x1 = 1 y x2 = 2 . De manera similar para experto-2, y1 = 1 y y2 = 3 . Entonces, la condición x1 < x2 e y1 < y2 se cumple y podemos decir que las filas del elemento 1 y el elemento 2 son pares concordantes.
Del mismo modo, eche un vistazo a las filas del elemento 2 y el elemento 4. Sea para experto-1, x1 = 2 y x2 = 4 . De manera similar para experto-2, y1 = 3 y y2 = 2 . Entonces, la condición x1 < x2 e y1 > y2 se cumple y podemos decir que las filas del elemento 2 y el elemento 4 son pares discordantes.
Así, comparando cada fila puedes calcular el número de pares concordantes y discordantes. La solución completa se da en la siguiente tabla.
1 | ||||||
---|---|---|---|---|---|---|
2 | C | |||||
3 | C | C | ||||
4 | C | D | D | |||
5 | C | C | C | C | ||
6 | C | C | C | D | D | |
7 | C | C | C | C | D | D |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
Paso 2:
Entonces, de la tabla anterior, encontramos que,
El número de pares concordantes es: 15
El número de pares discordantes es: 6
El número total de muestras/elementos es: 7
Por lo tanto, aplicando la fórmula del coeficiente de correlación de rangos de Kendall
tau = (15 – 6) / 21 = 0,42857
Este resultado dice que si es básicamente alto, entonces existe un amplio acuerdo entre los dos expertos. De lo contrario, si el experto-1 no está completamente de acuerdo con el experto-2, podría obtener incluso valores negativos.
kendalltau() : funciones de Python para calcular el coeficiente de correlación de rango de Kendall en Python
Sintaxis:
kendalltau(x, y)
- x, y: listas numéricas con la misma longitud
Código: programa Python para ilustrar la correlación de Kendall Rank
Python
# Import required libraries from scipy.stats import kendalltau # Taking values from the above example in Lists X = [1, 2, 3, 4, 5, 6, 7] Y = [1, 3, 6, 2, 7, 4, 5] # Calculating Kendall Rank correlation corr, _ = kendalltau(X, Y) print('Kendall Rank correlation: %.5f' % corr) # This code is contributed by Amiya Rout
Producción:
Kendall Rank correlation: 0.42857
Publicación traducida automáticamente
Artículo escrito por AmiyaRanjanRout y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA