Prueba de cola superior de la media poblacional con varianza desconocida en R

Una prueba de hipótesis estadística es un método de inferencia estadística que se utiliza para decidir si los datos disponibles respaldan suficientemente una hipótesis en particular. Los pasos convencionales que se siguen al formular la prueba de hipótesis, se enumeran a continuación

  • Enunciar hipótesis nula (Ho) e hipótesis alternativa (Ha)
  • Recopile una muestra relevante de datos para probar la hipótesis.
  • Elija el nivel de significación para la prueba de hipótesis.
  • Realice una prueba estadística adecuada.
  • Con base en las estadísticas de prueba y el valor p, decida si rechazar o no rechazar su hipótesis nula.

 

Convencionalmente, en una prueba de cola superior, la hipótesis nula establece que la verdadera media de la población (μo) es menor que el valor medio hipotético (μ). No podemos rechazar la hipótesis nula si el estadístico de prueba es menor que el valor crítico en el nivel de significancia elegido. En este artículo, analicemos cómo realizar una prueba de cola superior de la media poblacional con varianza desconocida.

Aquí la suposición es que la varianza de la población σ2 es desconocida. Sea s2 la varianza muestral. Para n más grande (generalmente >30), la población de las siguientes estadísticas de todas las muestras posibles de tamaño n es aproximadamente una distribución t de Student con n – 1 grado de libertad (DOF).

Definamos el estadístico de prueba basado en la distribución t de la siguiente manera

 

si t >= −t α , donde tα es el percentil 100(1 − α) de la distribución t de Student con n − 1 grado de libertad, podemos rechazar la hipótesis nula.

Tratemos de entender la prueba de la cola superior con varianza desconocida considerando un estudio de caso.

Suponga que la empresa de etiquetado de datos afirma que hay menos de 2 errores en las etiquetas marcadas en una sola página. Suponga que la cantidad media real de error por página 2.12 y la desviación estándar de la muestra es 0.2. En el nivel de significancia de .05, ¿es posible rechazar la afirmación de la empresa para un tamaño de muestra de 40 páginas?

Hipótesis nula : errores de etiqueta por página <= 2

Hipótesis alternativa : errores de etiqueta por página > 2

Nivel de significancia : 0.05

Ejemplo:

Calculemos el estadístico de prueba

R

xbar = 2 # sample mean 
mu0 = 2.12 # hypothesized value 
s = 0.2 # sample standard deviation 
n = 40 # sample size 
t = (xbar-mu0)/(s/sqrt(n)) 
t # test statistic

Producción:

3.7947331

Ahora, calculemos el valor crítico a un nivel de significancia de 0.05,

R

alpha = .05 
t.alpha = qt(1-alpha, df=n-1) 
t.alpha # critical value

Producción:

1.68487

El estadístico de prueba 3,794733 es mucho mayor que el valor crítico de 1,68487, lo que significa que, según nuestra suposición inicial, aquí t > tα, por lo que rechazamos la hipótesis nula.

Por lo tanto, al nivel de significancia de .05, rechazamos la afirmación de la empresa de que significa que los errores de etiquetado por página no son menores a 2 para una muestra de 40 páginas. Aquí, no tenemos suficiente evidencia para no rechazar el reclamo de la compañía.

Publicación traducida automáticamente

Artículo escrito por jssuriyakumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *