Prueba de cola superior de la media poblacional con varianza conocida en R

Una prueba de hipótesis estadística es un método de inferencia estadística que se utiliza para decidir si los datos disponibles respaldan suficientemente una hipótesis en particular.

Los pasos convencionales que se siguen al formular la prueba de hipótesis, se enumeran a continuación

Enunciar hipótesis nula (Ho) e hipótesis alternativa (Ha)
Recopile una muestra relevante de datos para probar la hipótesis.
Elija el nivel de significación para la prueba de hipótesis.
Realice una prueba estadística adecuada.
Con base en las estadísticas de prueba y el valor p, decida si rechazar o no rechazar su hipótesis nula.

Convencionalmente, en una prueba de cola superior, la hipótesis nula establece que la verdadera media de la población (μo) es menor que el valor medio hipotético (μ). No podemos rechazar la hipótesis nula si el estadístico de prueba es menor que el valor crítico en el nivel de significancia elegido. En este artículo, analicemos cómo realizar una prueba de cola superior de la media poblacional con varianza conocida.

Aquí la suposición es que se conoce la varianza de la población σ2. Del Teorema del Límite Central (CLT), la población. las medias muestrales de todas las muestras posibles de una población siguen aproximadamente una distribución normal. Definamos la estadística de prueba basada en CLT de la siguiente manera

$z = \frac{\bar{x}-\mu }{\sigma /\sqrt{n}}$

Si z >= −zα, donde zα es el percentil 100(1 − α) de la distribución normal estándar, tendremos que rechazar la hipótesis nula.

Tratemos de entender la prueba de la cola superior considerando un estudio de caso.

Suponga que la empresa de etiquetado de datos afirma que hay menos de 2 errores en las etiquetas marcadas en una sola página. Suponga que la cantidad media real de error por página 2.12 y la desviación estándar de la población es 0.2. Con un nivel de significación de .05, ¿podemos rechazar la hipótesis nula de que el error medio de etiquetado de datos por página es mayor que 2 errores?

Ejemplo:

Comencemos por calcular el error estándar de la media como se muestra

R

sample_mean = 2.12
  
# hypothesized mean value
m0 = 2 
  
pop_std_dev = 0.25
sample_size = 40
  
# test statistic
z = (xbar-mu0)/(sigma/sqrt(n)) 
z

Producción:

3.035786553

Luego calcule el límite superior de las medias muestrales para las cuales no se rechazaría la hipótesis nula μo ≤ 2.

R

alpha = .05 
  
# critical value
z.alpha = qnorm(1-alpha) 
z.alpha

Producción:

1.644

El estadístico de prueba 3.03 es mayor que el valor crítico de 1.6449. Por lo tanto, a un nivel de significación de 0,05, rechazamos la hipótesis nula de que el error medio de etiquetado no es inferior a 2 por página.

Publicación traducida automáticamente

Artículo escrito por jssuriyakumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

R

R

Deja una respuesta Cancelar la respuesta