Intervalo de confianza – Part 1

Requisitos previos: prueba t, prueba z

En términos simples, el intervalo de confianza es un rango en el que estamos seguros de que existe un valor real. La selección de un nivel de confianza para un intervalo determina la probabilidad de que el intervalo de confianza contenga el verdadero valor del parámetro. Este rango de valores se usa generalmente para tratar con datos basados ​​en la población, extrayendo información específica y valiosa con cierta confianza, de ahí el término ‘Intervalo de confianza’. 

Fig. 1. Muestra el aspecto general de un intervalo de confianza.

Fig. 1: Ilustración del intervalo de confianza

Nivel de confianza: 

El nivel de confianza describe la incertidumbre asociada con un método de muestreo. 

Supongamos que usamos el mismo método de muestreo (por ejemplo, la media de la muestra) para calcular una estimación de intervalo diferente para cada muestra. Algunas estimaciones de intervalo incluirían el parámetro de población real y otras no. 

Un nivel de confianza del 90 % significa que esperaríamos que el 90 % de las estimaciones de intervalo incluyeran el parámetro de población. Un nivel de confianza del 95 % significa que el 95 % de los intervalos incluiría el parámetro de población.

Por ejemplo, supongamos que está encuestando a una altura promedio de hombres en una ciudad en particular. Para encontrar eso, establece un nivel de confianza del 95% y encuentra que el intervalo de confianza del 95% es (168,182). Eso significa que si repites esto una y otra vez, el 95 por ciento de las veces la altura de un hombre estaría entre 168 cm y 182 cm.

Construcción de un intervalo de confianza: 

La construcción de un intervalo de confianza implica 4 pasos. 

Step 1: Identify the sample problem. Choose the statistic (like sample mean, etc) that 
    you will use to estimate population parameter.

Step 2: Select a confidence level. (Usually, it is 90%, 95% or 99%)

Step 3: Find the margin of error. (Usually given) If not given, use the following formula:-
    Margin of error = Critical value * Standard deviation 

Step 4: Specify the confidence interval. The uncertainty is denoted by the confidence level. 
    And the range of the confidence interval is defined by Eq-1.

ecuación-1

where, 
Sample_Statistic --> Can be any kind of statistic. (eg. sample mean)
Margin_of_Error  --> generally, its (± 2.5)

Cálculo de un intervalo de confianza  

El cálculo de IC requiere dos parámetros estadísticos. 

  • Media (μ): la media aritmética es el promedio de los números. Se define como la suma de n números dividida por la cuenta de números hasta n. (Eq-2)

\mu=\frac{1+2+3+\ldots+n}{n} \quad {.. Eq 2}

  • Desviación estándar (σ) —Es la medida de cuán dispersos están los números. Se define como la suma al cuadrado de la diferencia entre cada número y la media. (Eq-3)

\sigma=\sqrt{\sum \frac{\left(x_{i}-\mu\right)^{2}}{n}} \quad {... Eq 3}

a) Usando la distribución t 

Usamos la distribución t cuando el tamaño de la muestra es n<30

Considere el siguiente ejemplo. Se tomó una muestra aleatoria de 10 luchadores de la UFC y se midió su peso. Se encontró que el peso medio era de 240 kg. Construya una estimación del intervalo de confianza del 95% para el peso medio. La desviación estándar de la muestra fue de 25 kg. Encuentre un intervalo de confianza para una muestra del peso promedio real de todos los peleadores de UFC.

Step 1 - Subtract 1 from your sample size.[Eq-4] 
     This gives the degrees of freedom (df), required in Step-3.  

d f=n-1 \quad {... Eq 4}

where, 
df = degree of freedom
n = sample size 

Usando Eq-4, obtenemos df = 10 – 1 = 9.

Step 2 - Subtract the confidence interval from 1, then divide by two.
 [Eq-5]
     This gives the significance level (α), required in Step-3. 

\alpha=\frac{1-C L}{2} \quad {... Eq 5}

α = Significance level
CL = Confidence Level

Usando Eq-5, obtenemos α = (1 – .95) / 2 = 0.025

Step 3 - Use the values of α and df in the t-distribution table and find the value of t.  

(df)/(a) 0.1 0.05 . .

1.282 1.645 . .

1

3.078 6.314 . .

2

1.886 2.920 . .

:

: : . .

8

1.397 1.860 . .
. .

Usando los valores de df y α en la tabla de distribución t, obtenemos t = 2.262.

Step 4 - Use the t-value obtained in step 3 in the formula given for Confidence Interval 
      with t-distribution. [Eq-6]

\mu \pm t\left(\frac{\sigma}{\sqrt{n}}\right) \quad {...Eq6}

where,
μ = mean
t = chosen t-value from the table above
σ = the standard deviation
n = number of observations

Entonces, poniendo los valores en Eq-6, obtenemos

\begin{array}{l} \Rightarrow 240 \pm(2.262)^{*}(25 / \sqrt{10}) \\ \Rightarrow 240 \pm 17.883 \\ \Rightarrow(240-17.883,240+17.883) \\ \Rightarrow(222.117,257.883) \end{array}

where,
Lower Limit = 222.117
Upper Limit = 257.883

Por lo tanto, estamos 95% seguros de que el verdadero peso medio de los peleadores de UFC está entre 222.117 y 257.883.

b) Usando una distribución z

Usamos la distribución z cuando el tamaño de la muestra es n>30. La prueba Z es más útil cuando se conoce la desviación estándar. 

Considere el siguiente ejemplo. Se tomó una muestra aleatoria de 50 mujeres adultas y se midió su recuento de glóbulos rojos. La media de la muestra es 4,63 y la desviación estándar del recuento de glóbulos rojos es 0,54. Construya una estimación del intervalo de confianza del 95 % para el verdadero recuento medio de glóbulos rojos en mujeres adultas.

Step 1 - Find the mean. [Eq-2] (If not already given)
Step 2 - Find the standard deviation. [Eq-3] (If not already given)
Step 3 - Determine the z-value for the specified confidence interval. 
     (some common values in the table given below)
Intervalo de confianza valor z

90%

1.645

99%

2.576
Step 4 - Use the z-value obtained in step 3 in the formula given for Confidence Interval 
      with z-distribution. [Eq-7]

\mu \pm z\left(\frac{\sigma}{\sqrt{n}}\right) \quad {.....Eq7}

where,
μ = mean
z = chosen z-value from the table above
σ = the standard deviation
n = number of observations

Poniendo los valores en Eq-7, obtenemos

\begin{array}{l} \Rightarrow4.63 \pm(1.960)^{*}(0.54 / \sqrt{50}) \\ \Rightarrow 4.63 \pm 0.149 \\ \Rightarrow(4.63-0.149,4.63+0.149) \\ \Rightarrow(4.480,4.780) \end{array}

where,
Lower Limit = 4.480
Upper Limit = 4.780

Por lo tanto, tenemos un 95 % de confianza en que el verdadero recuento medio de glóbulos rojos de las mujeres adultas está entre 4,480 y 4,780.

El intervalo de confianza es uno de los conceptos fundamentales de la estadística. Dice una afirmación sobre los datos. Se pueden utilizar varios métodos de muestreo, como la media, la mediana, etc., en función de los datos presentes. También se puede determinar qué distribución usar y cuándo para obtener los mejores resultados. Para cualquier duda/consulta, comenta abajo.  

Publicación traducida automáticamente

Artículo escrito por prakharr0y y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *