¿Cómo calcular los intervalos de confianza en Python?

 En este artículo, veremos las diferentes formas de calcular los intervalos de confianza usando varias distribuciones en el lenguaje de programación Python. El intervalo de confianza para una media es un rango de valores que probablemente contenga una media poblacional con un cierto nivel de confianza.

Fórmula:

Confidence Interval = x(+/-)t*(s/√n)
  • x: media muestral
  • t: valor t que corresponde al nivel de confianza
  • s: desviación estándar de la muestra
  • n: tamaño de la muestra

Método 1: Calcule los intervalos de confianza utilizando la distribución t

Este enfoque se usa para calcular los intervalos de confianza para el conjunto de datos pequeño donde n<=30 y para esto, el usuario debe llamar a la función t.interval() de la biblioteca scipy.stats para obtener el intervalo de confianza para una media de población de el conjunto de datos dado en python.

Sintaxis: st.t.interval(alpha, length, loc, scale)) 

Parámetros:

  • alfa: Probabilidad de que se extraiga un RV del rango devuelto.
  • longitud: longitud del conjunto de datos
  • loc: parámetro de ubicación
  • escala: parámetro de escala

Ejemplo 1:

En este ejemplo, usaremos el conjunto de datos de tamaño (n = 20) y calcularemos los intervalos de confianza del 90% usando la distribución t usando la función t.interval() y pasando el parámetro alfa a 0.90 en el python.

Python

import numpy as np
import scipy.stats as st
  
# define sample data
gfg_data = [1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 
            3, 4, 4, 5, 5, 5, 6, 7, 8, 10]
  
# create 90% confidence interval
st.t.interval(alpha=0.90, df=len(gfg_data)-1,
              loc=np.mean(gfg_data),
              scale=st.sem(gfg_data))

Producción:

(2.962098014195961, 4.837901985804038)

Ejemplo 2:

En este ejemplo, usaremos el conjunto de datos de tamaño (n = 20) y calcularemos los intervalos de confianza del 90% usando la distribución t usando la función t.interval() y pasando el parámetro alfa a 0.99 en el python.

Python

import numpy as np
import scipy.stats as st
  
# define sample data
gfg_data = [1, 1, 1, 2, 2, 2, 3, 3, 3,
            3, 3, 4, 4, 5, 5, 5, 6,
            7, 8, 10]
  
# create 99% confidence interval
st.t.interval(alpha=0.99,
              df=len(gfg_data)-1,
              loc=np.mean(gfg_data), 
              scale=st.sem(gfg_data))

Producción:

(2.3481954013214263, 5.4518045986785735)

Interpretación del ejemplo 1 y ejemplo 2:

En el caso del ejemplo 1, el intervalo medio de confianza calculado de la población con 90 % es (2,96-4,83), y en el ejemplo 2 cuando se calcula el intervalo medio de confianza de la población con 99 % es (2,34-5,45), puede interpretarse que el intervalo de confianza del ejemplo 2 es más amplio que el intervalo de confianza del ejemplo 1 con el 95 % de la población, lo que significa que hay un 99 % de posibilidades de que el intervalo de confianza de [2.34, 5.45] contenga la verdadera media de la población

Método 2: Calcule los intervalos de confianza utilizando la distribución normal

Este enfoque se usa para calcular los intervalos de confianza para el gran conjunto de datos donde n>30 y para esto, el usuario debe llamar a la función norm.interval() de la biblioteca scipy.stats para obtener el intervalo de confianza para una media de población de la conjunto de datos dado donde el conjunto de datos se distribuye normalmente en python.

Sintaxis: st.norm.interval(alpha, loc, scale)) 

Parámetros:

  • alfa: Probabilidad de que se extraiga un RV del rango devuelto.
  • loc: parámetro de ubicación
  • escala: parámetro de escala

Ejemplo 3:

En este ejemplo, usaremos el conjunto de datos aleatorios de tamaño (n = 100) y calcularemos los intervalos de confianza del 90% usando la distribución normal usando la función norm.interval() y pasando el parámetro alfa a 0.90 en el python .

Python

import numpy as np
import scipy.stats as st
  
# define sample data
gfg_data = np.random.randint(5, 10, 100)
  
# create 90% confidence interval
# for population mean weight
st.norm.interval(alpha=0.90,
                 loc=np.mean(gfg_data),
                 scale=st.sem(gfg_data))

Producción:

(6.920661262464349, 7.3593387375356505)

Ejemplo 4:

En este ejemplo, usaremos el conjunto de datos aleatorios de tamaño (n = 100) y calcularemos los intervalos de confianza del 99% usando la distribución normal usando la función norm.interval() y pasando el parámetro alfa a 0.99 en el python .

Python

import numpy as np
import scipy.stats as st
  
# define sample data
gfg_data = np.random.randint(5, 10, 100)
  
# create 99% confidence interval
# for population mean weight
st.norm.interval(alpha=0.99, 
                 loc=np.mean(gfg_data),
                 scale=st.sem(gfg_data))

Producción:

(6.689075889330163, 7.450924110669837)

Interpretación del ejemplo 3 y ejemplo 4:

En el caso del ejemplo 3, el intervalo medio de confianza calculado de la población con 90 % es (6,92-7,35), y en el ejemplo 4 cuando se calcula el intervalo medio de confianza de la población con 99 % es (6,68-7,45), puede puede interpretarse que el intervalo de confianza del ejemplo 4 es más amplio que el intervalo de confianza del ejemplo 3 con el 95 % de la población, lo que significa que hay un 99 % de posibilidades de que el intervalo de confianza de [6.68, 7.45] contenga las verdaderas medias de la población.

Publicación traducida automáticamente

Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *