Intentaremos comprender la prueba T en la programación R con la ayuda de un ejemplo. Supongamos que un empresario con dos tiendas de dulces en una ciudad quiere comprobar si el número promedio de dulces vendidos en un día en ambas tiendas es el mismo o no.
Entonces, el empresario toma el número promedio de dulces vendidos a 15 personas al azar en las respectivas tiendas. Descubrió que la primera tienda vendió 30 dulces en promedio, mientras que la segunda tienda vendió 40. Entonces, desde el punto de vista del propietario, la segunda tienda estaba haciendo mejores negocios que la anterior. Pero lo que hay que notar es que el conjunto de datos se basa en un mero número de personas aleatorias y no pueden representar a todos los clientes. Aquí es donde entra en juego la prueba T, nos ayuda a comprender que la diferencia entre los dos medios es real o simplemente por casualidad.
Matemáticamente, lo que hace la prueba t es tomar una muestra de ambos conjuntos y establecer el problema asumiendo una hipótesis nula de que las dos medias son iguales.
Clasificación de las pruebas T
- Prueba T de una muestra
- Prueba T de dos muestras
- Prueba T de muestra pareada
Prueba T de una muestra
La prueba T para una muestra se usa para probar la diferencia estadística entre la media de una muestra y un valor conocido o supuesto/hipotetizado de la media en la población.
Entonces, para realizar una prueba t de una muestra en R, usaríamos la sintaxis t.test(y, mu = 0) donde x es el nombre de la variable de interés y mu se establece igual a la media especificada por el hipótesis nula.
Por ejemplo:
R
set.seed(0) sweetSold <- c(rnorm(50, mean = 140, sd = 5)) t.test(sweetSold, mu = 150) # Ho: mu = 150
Producción:
Prueba T de dos muestras
Se utiliza para ayudarnos a comprender que la diferencia entre los dos medios es real o simplemente casual.
La forma general de la prueba es t.test(y1, y2, paired=FALSE). De forma predeterminada, R supone que las varianzas de y1 e y2 son desiguales, por lo que se aplica de forma predeterminada la prueba de Welch. Para alternar esto, usamos la bandera var.equal=TRUE.
Por ejemplo:
R
set.seed(0) shopOne <- rnorm(50, mean = 140, sd = 4.5) shopTwo <- rnorm(50, mean = 150, sd = 4) t.test(shopOne, shopTwo, var.equal = TRUE)
Producción:
Prueba T de muestra pareada
Este es un procedimiento estadístico que se utiliza para determinar si la diferencia media entre dos conjuntos de observaciones es cero. En una prueba t de muestras pareadas, cada sujeto se mide dos veces, lo que da como resultado pares de observaciones.
La prueba se ejecuta usando la sintaxis t.test(y1, y2, paired=TRUE)
Por ejemplo:
R
set.seed(2820) sweetOne <- c(rnorm(100, mean = 14, sd = 0.3)) sweetTwo <- c(rnorm(100, mean = 13, sd = 0.2)) t.test(sweetOne, sweetTwo, paired = TRUE)
Producción:
Publicación traducida automáticamente
Artículo escrito por mayukh_bagchi y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA