Requisitos previos: prueba t, prueba z
En términos simples, el intervalo de confianza es un rango en el que estamos seguros de que existe un valor real. La selección de un nivel de confianza para un intervalo determina la probabilidad de que el intervalo de confianza contenga el verdadero valor del parámetro. Este rango de valores se usa generalmente para tratar con datos basados en la población, extrayendo información específica y valiosa con cierta confianza, de ahí el término ‘Intervalo de confianza’.
Fig. 1. Muestra el aspecto general de un intervalo de confianza.
Nivel de confianza:
El nivel de confianza describe la incertidumbre asociada con un método de muestreo.
Supongamos que usamos el mismo método de muestreo (por ejemplo, la media de la muestra) para calcular una estimación de intervalo diferente para cada muestra. Algunas estimaciones de intervalo incluirían el parámetro de población real y otras no.
Un nivel de confianza del 90 % significa que esperaríamos que el 90 % de las estimaciones de intervalo incluyeran el parámetro de población. Un nivel de confianza del 95 % significa que el 95 % de los intervalos incluiría el parámetro de población.
Por ejemplo, supongamos que está encuestando a una altura promedio de hombres en una ciudad en particular. Para encontrar eso, establece un nivel de confianza del 95% y encuentra que el intervalo de confianza del 95% es (168,182). Eso significa que si repites esto una y otra vez, el 95 por ciento de las veces la altura de un hombre estaría entre 168 cm y 182 cm.
Construcción de un intervalo de confianza:
La construcción de un intervalo de confianza implica 4 pasos.
Step 1: Identify the sample problem. Choose the statistic (like sample mean, etc) that you will use to estimate population parameter. Step 2: Select a confidence level. (Usually, it is 90%, 95% or 99%) Step 3: Find the margin of error. (Usually given) If not given, use the following formula:- Margin of error = Critical value * Standard deviation Step 4: Specify the confidence interval. The uncertainty is denoted by the confidence level. And the range of the confidence interval is defined by Eq-1.
where, Sample_Statistic --> Can be any kind of statistic. (eg. sample mean) Margin_of_Error --> generally, its (± 2.5)
Cálculo de un intervalo de confianza
El cálculo de IC requiere dos parámetros estadísticos.
- Media (μ): la media aritmética es el promedio de los números. Se define como la suma de n números dividida por la cuenta de números hasta n. (Eq-2)
- Desviación estándar (σ) —Es la medida de cuán dispersos están los números. Se define como la suma al cuadrado de la diferencia entre cada número y la media. (Eq-3)
a) Usando la distribución t
Usamos la distribución t cuando el tamaño de la muestra es n<30 .
Considere el siguiente ejemplo. Se tomó una muestra aleatoria de 10 luchadores de la UFC y se midió su peso. Se encontró que el peso medio era de 240 kg. Construya una estimación del intervalo de confianza del 95% para el peso medio. La desviación estándar de la muestra fue de 25 kg. Encuentre un intervalo de confianza para una muestra del peso promedio real de todos los peleadores de UFC.
Step 1 - Subtract 1 from your sample size.[Eq-4] This gives the degrees of freedom (df), required in Step-3.
where, df = degree of freedom n = sample size
Usando Eq-4, obtenemos df = 10 – 1 = 9.
Step 2 - Subtract the confidence interval from 1, then divide by two. [Eq-5] This gives the significance level (α), required in Step-3.
α = Significance level CL = Confidence Level
Usando Eq-5, obtenemos α = (1 – .95) / 2 = 0.025
Step 3 - Use the values of α and df in the t-distribution table and find the value of t.
(df)/(a) | 0.1 | 0.05 | . . |
---|---|---|---|
∞ |
1.282 | 1.645 | . . |
1 |
3.078 | 6.314 | . . |
2 |
1.886 | 2.920 | . . |
: |
: | : | . . |
8 |
1.397 | 1.860 | . . |
. . |
Usando los valores de df y α en la tabla de distribución t, obtenemos t = 2.262.
Step 4 - Use the t-value obtained in step 3 in the formula given for Confidence Interval with t-distribution. [Eq-6]
where, μ = mean t = chosen t-value from the table above σ = the standard deviation n = number of observations
Entonces, poniendo los valores en Eq-6, obtenemos
where, Lower Limit = 222.117 Upper Limit = 257.883
Por lo tanto, estamos 95% seguros de que el verdadero peso medio de los peleadores de UFC está entre 222.117 y 257.883.
b) Usando una distribución z
Usamos la distribución z cuando el tamaño de la muestra es n>30. La prueba Z es más útil cuando se conoce la desviación estándar.
Considere el siguiente ejemplo. Se tomó una muestra aleatoria de 50 mujeres adultas y se midió su recuento de glóbulos rojos. La media de la muestra es 4,63 y la desviación estándar del recuento de glóbulos rojos es 0,54. Construya una estimación del intervalo de confianza del 95 % para el verdadero recuento medio de glóbulos rojos en mujeres adultas.
Step 1 - Find the mean. [Eq-2] (If not already given) Step 2 - Find the standard deviation. [Eq-3] (If not already given) Step 3 - Determine the z-value for the specified confidence interval. (some common values in the table given below)
Intervalo de confianza | valor z |
90% |
1.645 |
99% |
2.576 |
Step 4 - Use the z-value obtained in step 3 in the formula given for Confidence Interval with z-distribution. [Eq-7]
where, μ = mean z = chosen z-value from the table above σ = the standard deviation n = number of observations
Poniendo los valores en Eq-7, obtenemos
where, Lower Limit = 4.480 Upper Limit = 4.780
Por lo tanto, tenemos un 95 % de confianza en que el verdadero recuento medio de glóbulos rojos de las mujeres adultas está entre 4,480 y 4,780.
El intervalo de confianza es uno de los conceptos fundamentales de la estadística. Dice una afirmación sobre los datos. Se pueden utilizar varios métodos de muestreo, como la media, la mediana, etc., en función de los datos presentes. También se puede determinar qué distribución usar y cuándo para obtener los mejores resultados. Para cualquier duda/consulta, comenta abajo.
Publicación traducida automáticamente
Artículo escrito por prakharr0y y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA