Cómo realizar la prueba de McNemar en Python

Prueba de McNemar: Esta es una prueba no paramétrica para los datos nominales apareados. Esta prueba se usa cuando queremos encontrar el cambio en la proporción de los datos pareados. Esta prueba también se conoce como prueba Chi-Square de McNemar. Esto se debe a que la estadística de prueba tiene una distribución de chi-cuadrado.

Supuestos para la prueba de McNemar:

A continuación se presentan las principales suposiciones para la prueba:

  • Debemos tener una variable nominal con dos categorías (variables dicotómicas) y una variable independiente con dos grupos conectados.
  • Dos conjuntos de variables dependientes deben ser mutuamente excluyentes. En palabras simples, los participantes no pueden ser parte de más de un grupo.
  • La muestra debe ser una muestra aleatoria.

Realice la prueba de McNemar en Python:

Consideremos que los investigadores están interesados ​​en saber si un video publicitario de un determinado producto puede alterar la opinión de las personas sobre el producto. Se realizó una encuesta a 50 personas para saber si quieren comprar el producto. Luego, se mostró el video publicitario a las 50 personas y se volvió a realizar la encuesta después de ver el video. Los datos se representan en la siguiente tabla.

  Apoyo No apoyes
Antes del anuncio Vídeo 30 20
Después del anuncio de vídeo 10 40

Para saber si existe una diferencia estadísticamente significativa en la proporción de personas que quieren comprar el producto antes y después de ver el video, podemos realizar el Test de McNemar. Realizar la prueba de McNermar es un proceso paso a paso. Estos pasos se explican a continuación.

Paso 1: Crear los datos.

Python3

# Create a dataset
data = [[30, 20],
         [10, 40]]

Paso 2: Realice la prueba de McNemar.

Ahora realicemos la prueba de McNemar. Statsmodels proporciona la función mcnemar() en la biblioteca de Python cuya sintaxis se proporciona a continuación.

Sintaxis:

mcnemar(tabla, exacto=Verdadero, corrección=Verdadero) 

Parámetros:

  • table: Representa la tabla de contingencia cuadrada
  • exacto = Verdadero: Se utilizará la distribución binomial.
  • exacto = Falso: Se utilizará la distribución Chi-Cuadrado
  • corrección = Verdadero: Entonces se usaría la corrección de continuidad. Como una regla. esta corrección se aplicaría cualquier recuento de celdas en la tabla no es más de 4

Ejemplo:

Python3

# Import library
from statsmodels.stats.contingency_tables import mcnemar
  
# Create a dataset
data = [[30, 20],
        [10, 40]]
  
# McNemar's Test without any continuity correction
print(mcnemar(data, exact=False))
  
# McNemar's Test with the continuity correction
print(mcnemar(data, exact=False, correction=False))

Producción:

Producción

Para ambos casos, apliquemos o no la corrección de continuidad, el valor p de la prueba no es inferior a 0,05. Esto significa que en ambos casos no podemos rechazar la hipótesis nula y podemos llegar a la conclusión de que la proporción de personas que apoyaron el producto antes y después de ver el video de marketing no fue significativamente diferente desde el punto de vista estadístico.

Publicación traducida automáticamente

Artículo escrito por bhuwanesh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *