Cómo realizar una prueba T de muestras emparejadas en Python

Prueba T de muestras pareadas: esta prueba también se conoce como prueba t de muestras dependientes. Es un concepto estadístico y se utiliza para verificar si la diferencia media entre los dos conjuntos de observación es igual a cero. Cada entidad se mide dos veces en esta prueba que da como resultado los pares de observaciones.

Sintaxis para instalar la biblioteca Scipy en nuestro sistema:

pip install scipy

¿Cómo realizar una prueba T de muestras emparejadas en Python?

Consideremos que queremos saber si un aceite de motor afecta significativamente el kilometraje del automóvil de diferentes marcas. Para probar esto, tenemos 10 autos en un garaje dopados inicialmente con aceite de motor original. Hemos anotado su kilometraje durante 100 kilómetros cada uno. Luego, tenemos cada uno de los coches dopados con otro aceite de motor (diferente al original). Luego, el kilometraje de los autos se calcula para 100 kilómetros cada uno. Para comparar la diferencia entre el kilometraje medio de la primera y la segunda prueba, usamos una prueba t de muestras pareadas porque para cada automóvil, la puntuación de la primera prueba se puede emparejar con la puntuación de la segunda prueba. La realización de la prueba T de muestras pareadas es un proceso paso a paso.

Paso 1: construir los datos.

Necesitamos dos arrays para contener el kilometraje previo y posterior de los autos.

Python3

# pre holds the mileage before applying
# the different engine oil
pre = [88, 82, 84, 93, 75, 78, 84, 87,
       95, 91, 83, 89, 77, 68, 91]
  
# post holds the mileage before applying 
# the different engine oil
post = [91, 84, 88, 90, 79, 80, 88, 90, 
        90, 96, 88, 89, 81, 74, 92]

Paso 2: Realización de una prueba T de muestras pareadas.

La biblioteca Scipy contiene la función ttest_rel() mediante la cual podemos realizar la prueba t de muestras emparejadas en Python. La sintaxis se da a continuación,

Sintaxis:

ttest_rel(arr1, arr2)

Parámetros:

  • arr1: representa una array de observaciones de muestra del grupo 1
  • arr2: Representa una array de observaciones de muestra del grupo 2

Ejemplo:

Python3

# Importing library
import scipy.stats as stats
  
# pre holds the mileage before 
# applying the different engine oil
pre = [30, 31, 34, 40, 36, 35,
       34, 30, 28, 29]
  
# post holds the mileage after 
# applying the different engine oil
post = [30, 31, 32, 38, 32, 31,
        32, 29, 28, 30]
  
# Performing the paired sample t-test
stats.ttest_rel(pre, post)

Producción:

Producción

El estadístico de prueba resulta ser igual a 2,584 y el valor p bilateral correspondiente es 0,029.

Paso 3: Analizando la salida.

La prueba t de muestras pareadas sigue las hipótesis nula y alternativa:

  • H0: Significa que las puntuaciones medias previas y posteriores a la prueba son iguales
  • HA: Significa que las puntuaciones medias del pre-test y del post-test no son iguales

Como el valor p resulta ser igual a 0.029, que es menor que 0.05, rechazamos la hipótesis nula. Por lo tanto, tenemos suficientes pruebas para afirmar que la verdadera puntuación media de la prueba es diferente para los automóviles antes y después de aplicar el aceite de motor diferente.

Publicación traducida automáticamente

Artículo escrito por bhuwanesh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *