Error tipo II en la prueba de dos colas de la media poblacional con varianza desconocida en R

En este artículo, cubriremos los errores de tipo II en la prueba de dos colas de la media poblacional con varianza desconocida.

Convencionalmente, En una prueba de dos colas se utiliza en la prueba de hipótesis nula . La hipótesis nula (μo) es igual al valor medio hipotético (μ). No podemos rechazar la hipótesis nula si el estadístico de prueba se encuentra dentro del rango de valores críticos en el nivel de significación elegido. El error de tipo II es un error que ocurre si la prueba de hipótesis basada en una muestra aleatoria no puede rechazar la hipótesis nula incluso cuando la verdadera población significa μo no es igual al valor medio hipotético μ.

Aquí la suposición es que la varianza de la población σ2 es desconocida. Sea s2 la varianza muestral. Para n más grande (generalmente >30), la población de las siguientes estadísticas de todas las muestras posibles de tamaño n es aproximadamente una distribución t de Student con n-1 grado de libertad (DOF).

El rango de medias muestrales para una distribución t de Student se calcula de la siguiente manera.

t = \frac{\bar{X}-\mu }{s /\sqrt{n}}

Tratemos de entender el error tipo II considerando un caso de estudio

Suponga que el peso medio de los boxeadores en Asia el año pasado fue de 75,4 kg. En una muestra de 35 boxeadores en la misma época de este año en la misma región, el peso medio del boxeador es de 74,6 kg. Suponga que la desviación estándar de la muestra es de 2,5 kg. ¿Hay suficiente evidencia para rechazar la hipótesis nula de que el peso promedio del boxeador no difiere del año pasado en 0.05 de significación?

Comencemos calculando la estimación del error estándar

R

# sample size 
n = 35  
  
# sample standard deviation 
s = 2.5               
SE = s/sqrt(n); 
SE

Producción:

0.422577127364258

A continuación, calculamos los límites superior e inferior de las medias muestrales para las que no se rechazaría la hipótesis nula μ o = 74,6. En la salida, 73,74 es el límite inferior, mientras que 75,45 es el límite superior.

R

# significance level 
alpha = .05     
  
# hypothetical mean 
mu0 = 15.4           
I = c(alpha/2, 1-alpha/2) 
q = mu0 + qt(I, df=n-1) * SE;
q

Producción:

73.7412199531507      75.4587800468493

Los límites superior e inferior sugieren que mientras la media de la muestra esté entre 73.741 y 75.458 en una prueba de hipótesis, la hipótesis nula no será rechazada. Dado que asumimos que la media de la población real es 75,4 kg, podemos calcular las probabilidades de cola inferior de ambos extremos.

R

# assumed actual mean 
mu = 75.4             
p = pt((q - mu)/SE, df=n-1);
p

Producción:

0.000200411362802067     0.554903698326656

Finalmente, el % de probabilidad de error de tipo II es la probabilidad entre los dos puntos finales que se encuentra al encontrar la diferencia entre los dos puntos finales.

R

diff(p)

Producción:

0.554703286963854

Aquí podemos entender que, si el tamaño de la muestra de los boxeadores es 35, la desviación estándar de la muestra del peso del boxeador es de 2,5 kg y el peso medio real de la población es de 75,4 kg, entonces la probabilidad de error de tipo II para probar la hipótesis nula μ = 75,4 a un nivel de significación de 0,05 es del 55,47 %, y la potencia de la prueba de hipótesis es del 44,53 %.

Publicación traducida automáticamente

Artículo escrito por jssuriyakumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *