En este artículo, veremos las diferentes formas de calcular los intervalos de confianza usando varias distribuciones en el lenguaje de programación Python. El intervalo de confianza para una media es un rango de valores que probablemente contenga una media poblacional con un cierto nivel de confianza.
Fórmula:
Confidence Interval = x(+/-)t*(s/√n)
- x: media muestral
- t: valor t que corresponde al nivel de confianza
- s: desviación estándar de la muestra
- n: tamaño de la muestra
Método 1: Calcule los intervalos de confianza utilizando la distribución t
Este enfoque se usa para calcular los intervalos de confianza para el conjunto de datos pequeño donde n<=30 y para esto, el usuario debe llamar a la función t.interval() de la biblioteca scipy.stats para obtener el intervalo de confianza para una media de población de el conjunto de datos dado en python.
Sintaxis: st.t.interval(alpha, length, loc, scale))
Parámetros:
- alfa: Probabilidad de que se extraiga un RV del rango devuelto.
- longitud: longitud del conjunto de datos
- loc: parámetro de ubicación
- escala: parámetro de escala
Ejemplo 1:
En este ejemplo, usaremos el conjunto de datos de tamaño (n = 20) y calcularemos los intervalos de confianza del 90% usando la distribución t usando la función t.interval() y pasando el parámetro alfa a 0.90 en el python.
Python
import numpy as np import scipy.stats as st # define sample data gfg_data = [1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 5, 5, 5, 6, 7, 8, 10] # create 90% confidence interval st.t.interval(alpha=0.90, df=len(gfg_data)-1, loc=np.mean(gfg_data), scale=st.sem(gfg_data))
Producción:
(2.962098014195961, 4.837901985804038)
Ejemplo 2:
En este ejemplo, usaremos el conjunto de datos de tamaño (n = 20) y calcularemos los intervalos de confianza del 90% usando la distribución t usando la función t.interval() y pasando el parámetro alfa a 0.99 en el python.
Python
import numpy as np import scipy.stats as st # define sample data gfg_data = [1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 5, 5, 5, 6, 7, 8, 10] # create 99% confidence interval st.t.interval(alpha=0.99, df=len(gfg_data)-1, loc=np.mean(gfg_data), scale=st.sem(gfg_data))
Producción:
(2.3481954013214263, 5.4518045986785735)
Interpretación del ejemplo 1 y ejemplo 2:
En el caso del ejemplo 1, el intervalo medio de confianza calculado de la población con 90 % es (2,96-4,83), y en el ejemplo 2 cuando se calcula el intervalo medio de confianza de la población con 99 % es (2,34-5,45), puede interpretarse que el intervalo de confianza del ejemplo 2 es más amplio que el intervalo de confianza del ejemplo 1 con el 95 % de la población, lo que significa que hay un 99 % de posibilidades de que el intervalo de confianza de [2.34, 5.45] contenga la verdadera media de la población
Método 2: Calcule los intervalos de confianza utilizando la distribución normal
Este enfoque se usa para calcular los intervalos de confianza para el gran conjunto de datos donde n>30 y para esto, el usuario debe llamar a la función norm.interval() de la biblioteca scipy.stats para obtener el intervalo de confianza para una media de población de la conjunto de datos dado donde el conjunto de datos se distribuye normalmente en python.
Sintaxis: st.norm.interval(alpha, loc, scale))
Parámetros:
- alfa: Probabilidad de que se extraiga un RV del rango devuelto.
- loc: parámetro de ubicación
- escala: parámetro de escala
Ejemplo 3:
En este ejemplo, usaremos el conjunto de datos aleatorios de tamaño (n = 100) y calcularemos los intervalos de confianza del 90% usando la distribución normal usando la función norm.interval() y pasando el parámetro alfa a 0.90 en el python .
Python
import numpy as np import scipy.stats as st # define sample data gfg_data = np.random.randint(5, 10, 100) # create 90% confidence interval # for population mean weight st.norm.interval(alpha=0.90, loc=np.mean(gfg_data), scale=st.sem(gfg_data))
Producción:
(6.920661262464349, 7.3593387375356505)
Ejemplo 4:
En este ejemplo, usaremos el conjunto de datos aleatorios de tamaño (n = 100) y calcularemos los intervalos de confianza del 99% usando la distribución normal usando la función norm.interval() y pasando el parámetro alfa a 0.99 en el python .
Python
import numpy as np import scipy.stats as st # define sample data gfg_data = np.random.randint(5, 10, 100) # create 99% confidence interval # for population mean weight st.norm.interval(alpha=0.99, loc=np.mean(gfg_data), scale=st.sem(gfg_data))
Producción:
(6.689075889330163, 7.450924110669837)
Interpretación del ejemplo 3 y ejemplo 4:
En el caso del ejemplo 3, el intervalo medio de confianza calculado de la población con 90 % es (6,92-7,35), y en el ejemplo 4 cuando se calcula el intervalo medio de confianza de la población con 99 % es (6,68-7,45), puede puede interpretarse que el intervalo de confianza del ejemplo 4 es más amplio que el intervalo de confianza del ejemplo 3 con el 95 % de la población, lo que significa que hay un 99 % de posibilidades de que el intervalo de confianza de [6.68, 7.45] contenga las verdaderas medias de la población.
Publicación traducida automáticamente
Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA