La prueba Z es un método estadístico para determinar si la distribución de las estadísticas de prueba se puede aproximar a una distribución normal. Es el método para determinar si dos medias muestrales son aproximadamente iguales o diferentes cuando se conoce su varianza y el tamaño de la muestra es grande (debe ser >= 30).
Cuándo usar la prueba Z:
- El tamaño de la muestra debe ser mayor a 30. De lo contrario, debemos usar la prueba t.
- Las muestras deben extraerse al azar de la población.
- Se debe conocer la desviación estándar de la población.
- Las muestras que se extraen de la población deben ser independientes entre sí.
- Los datos deben tener una distribución normal, sin embargo, para muestras de gran tamaño, se supone que tienen una distribución normal.
Prueba de hipótesis
Una hipótesis es una conjetura/afirmación educada sobre una propiedad particular de un objeto. La prueba de hipótesis es una forma de validar la afirmación de un experimento.
- Hipótesis nula: la hipótesis nula es una afirmación de que el valor de un parámetro de población (como la proporción, la media o la desviación estándar) es igual a algún valor declarado. Rechazamos o no rechazamos la hipótesis nula. La hipótesis nula se denota por H 0 .
- Hipótesis alternativa: La hipótesis alternativa es la afirmación de que el parámetro tiene un valor que es diferente del valor declarado. Se denota por H A .
Nivel de significancia: Significa el grado de, por lo tanto,(∝)
Pasos para realizar la prueba Z:
- Primero, identifique las hipótesis nula y alternativa.
- Determinar el nivel de significación (∝).
- Encuentre el valor crítico de z en la prueba z usando
- Calcule las estadísticas de la prueba z. A continuación se muestra la fórmula para calcular las estadísticas de la prueba z.
- dónde,
- X¯: media de la muestra.
- Mu: media de la población.
- Sd: Desviación estándar de la población.
- n: tamaño de la muestra.
- Ahora compare con la hipótesis y decida si rechazar o no rechazar la hipótesis nula
Tipo de prueba Z
- Prueba de cola izquierda: en esta prueba, nuestra región de rechazo se ubica en el extremo izquierdo de la distribución. Aquí nuestra hipótesis nula es que el valor reclamado es menor o igual que el valor medio de la población.
- Prueba de cola derecha: en esta prueba, nuestra región de rechazo se ubica en el extremo derecho de la distribución. Aquí nuestra hipótesis nula es que el valor reclamado es menor o igual que el valor medio de la población.
- Prueba de dos colas: En esta prueba, nuestra región de rechazo se ubica en ambos extremos de la distribución. Aquí nuestra hipótesis nula es que el valor reclamado es igual al valor medio de la población.
A continuación se muestra el ejemplo de realización de la prueba z:
Problema : una escuela afirmó que el estudio de los estudiantes es más inteligente que la escuela promedio. Al calcular los puntajes de CI de 50 estudiantes, el promedio resulta ser 11. La media del CI de la población es 100 y la desviación estándar es 15. Indique si la afirmación del director es correcta o no con un nivel de significancia del 5%.
- Primero, definimos la hipótesis nula y la hipótesis alternativa. Nuestra hipótesis nula será:
y nuestra hipótesis alternativa.
- Indique el nivel de significación. Aquí, nuestro nivel de significación dado en esta pregunta (∝ =0.05), si no se da, tomamos ∝=0.05.
- Ahora, miramos hacia arriba a la tabla z. Para el valor de ∝=0.05, el puntaje z para la prueba de cola derecha es 1.645.
- Ahora, realizamos la prueba Z en el problema:
- Dónde:
- X = 110
- Media (mu) = 100
- Desviación estándar (sigma) = 15
- Nivel de significación (alfa) = 0,05
- norte = 50
- Aquí 4.71 >1.645, por lo que rechazamos la hipótesis nula. Si las estadísticas de la prueba z son menores que la puntuación z, entonces no rechazaremos la hipótesis nula.
Python3
# imports import math import numpy as np from numpy.random import randn from statsmodels.stats.weightstats import ztest # Generate a random array of 50 numbers having mean 110 and sd 15 # similar to the IQ scores data we assume above mean_iq = 110 sd_iq = 15/math.sqrt(50) alpha =0.05 null_mean =100 data = sd_iq*randn(50)+mean_iq # print mean and sd print('mean=%.2f stdv=%.2f' % (np.mean(data), np.std(data))) # now we perform the test. In this function, we passed data, in the value parameter # we passed mean value in the null hypothesis, in alternative hypothesis we check whether the # mean is larger ztest_Score, p_value= ztest(data,value = null_mean, alternative='larger') # the function outputs a p_value and z-score corresponding to that value, we compare the # p-value with alpha, if it is greater than alpha then we do not null hypothesis # else we reject it. if(p_value < alpha): print("Reject Null Hypothesis") else: print("Fail to Reject NUll Hypothesis")
Reject Null Hypothesis
Prueba z de dos muestras:
En esta prueba, hemos proporcionado 2 poblaciones normalmente distribuidas e independientes, y hemos extraído muestras al azar de ambas poblaciones. Aquí, consideramos que u 1 y u 2 son la media poblacional X 1 y X 2 son la media muestral observada. Aquí, nuestra hipótesis nula podría ser como:
e hipotesis alternativa
y la fórmula para calcular la puntuación de la prueba z:
donde sigma 1 y sigma 2 son la desviación estándar y n 1 y n 2 son el tamaño de muestra de la población correspondiente a u 1 y u 2 .
Error tipo 1 y error tipo II:
- Error de tipo I: se ha producido un error de tipo 1 cuando rechazamos la hipótesis nula, incluso cuando la hipótesis es verdadera. Este error se denota por alfa.
- Error tipo II: El error tipo II se ha producido cuando no rechazamos la hipótesis nula, incluso cuando la hipótesis es falsa. Este error se denota por beta.
La hipótesis nula es VERDADERA | La hipótesis nula es FALSA | |
---|---|---|
Rechazar hipótesis nula |
Error tipo I (Falso positivo) |
decisión correcta |
No rechazar la hipótesis nula | decisión correcta |
Error tipo II (Falso negativo) |