Prueba de McNemar: Esta es una prueba no paramétrica para los datos nominales apareados. Esta prueba se usa cuando queremos encontrar el cambio en la proporción de los datos pareados. Esta prueba también se conoce como prueba Chi-Square de McNemar. Esto se debe a que la estadística de prueba tiene una distribución de chi-cuadrado.
Supuestos para la prueba de McNemar:
A continuación se presentan las principales suposiciones para la prueba:
- Debemos tener una variable nominal con dos categorías (variables dicotómicas) y una variable independiente con dos grupos conectados.
- Dos conjuntos de variables dependientes deben ser mutuamente excluyentes. En palabras simples, los participantes no pueden ser parte de más de un grupo.
- La muestra debe ser una muestra aleatoria.
Realice la prueba de McNemar en Python:
Consideremos que los investigadores están interesados en saber si un video publicitario de un determinado producto puede alterar la opinión de las personas sobre el producto. Se realizó una encuesta a 50 personas para saber si quieren comprar el producto. Luego, se mostró el video publicitario a las 50 personas y se volvió a realizar la encuesta después de ver el video. Los datos se representan en la siguiente tabla.
Apoyo | No apoyes | |
---|---|---|
Antes del anuncio Vídeo | 30 | 20 |
Después del anuncio de vídeo | 10 | 40 |
Para saber si existe una diferencia estadísticamente significativa en la proporción de personas que quieren comprar el producto antes y después de ver el video, podemos realizar el Test de McNemar. Realizar la prueba de McNermar es un proceso paso a paso. Estos pasos se explican a continuación.
Paso 1: Crear los datos.
Python3
# Create a dataset data = [[30, 20], [10, 40]]
Paso 2: Realice la prueba de McNemar.
Ahora realicemos la prueba de McNemar. Statsmodels proporciona la función mcnemar() en la biblioteca de Python cuya sintaxis se proporciona a continuación.
Sintaxis:
mcnemar(tabla, exacto=Verdadero, corrección=Verdadero)
Parámetros:
- table: Representa la tabla de contingencia cuadrada
- exacto = Verdadero: Se utilizará la distribución binomial.
- exacto = Falso: Se utilizará la distribución Chi-Cuadrado
- corrección = Verdadero: Entonces se usaría la corrección de continuidad. Como una regla. esta corrección se aplicaría cualquier recuento de celdas en la tabla no es más de 4
Ejemplo:
Python3
# Import library from statsmodels.stats.contingency_tables import mcnemar # Create a dataset data = [[30, 20], [10, 40]] # McNemar's Test without any continuity correction print(mcnemar(data, exact=False)) # McNemar's Test with the continuity correction print(mcnemar(data, exact=False, correction=False))
Producción:
Para ambos casos, apliquemos o no la corrección de continuidad, el valor p de la prueba no es inferior a 0,05. Esto significa que en ambos casos no podemos rechazar la hipótesis nula y podemos llegar a la conclusión de que la proporción de personas que apoyaron el producto antes y después de ver el video de marketing no fue significativamente diferente desde el punto de vista estadístico.