¿Cómo encontrar intervalos de confianza en R?

El intervalo de confianza indica cuánta incertidumbre está presente en los datos estadísticos. En otras palabras, se define como un intervalo que representa un parámetro de población con una probabilidad de 1 – α. La expresión para el intervalo de confianza se da a continuación,

x̄ ± t α / 2,N – 1 S

Aquí,

x̄ ± t α / 2 : Significa el valor requerido para formar un área de α / 2 (cada cola de una distribución t donde 

  grado de libertad = n – 1)

S = s / √n :  Representa el error estándar de la media  

Determinación del intervalo de confianza en R: 

En primer lugar, necesitamos crear datos de muestra. R proporciona conjuntos de datos incorporados. En este artículo, vamos a utilizar el conjunto de datos del iris como ilustración. El conjunto de datos del iris representa la longitud del sépalo, el ancho del sépalo, la longitud del pétalo y el ancho del pétalo en centímetros. Proporciona los datos de cincuenta flores de cada una de las tres especies de iris. Las especies son:

  • Iris setosa
  • versicolor
  • virginica

R

# Printing the contents of iris inbuilt dataset
print(iris)

Producción:

Método 1: Cálculo de intervalos utilizando la base R

En este método, encontraremos el intervalo de confianza paso a paso usando fórmulas matemáticas y funciones R. Puede seguir los pasos a continuación para determinar el intervalo de confianza en R.

Paso 1: Calcular la media. El primer paso es determinar la media de los datos de muestra dados.

R

# R program to determine the mean
 
# Calculate the mean of the Sepal.Length
mean_value <- mean(iris$Sepal.Length)

Paso 2: Ahora calculemos el error estándar de la media. 

Para calcular el error estándar de la media (S ), necesitamos encontrar la desviación estándar (s) y la longitud de los datos de la muestra (n).

R

# Compute the size
n <- length(iris$Sepal.Length)
 
# Find the standard deviation
standard_deviation <- sd(iris$Sepal.Length)
 
# Find the standard error
standard_error <- standard_deviation / sqrt(n)

Paso 3: determine la puntuación t que está vinculada al nivel de confianza.

En este paso, calcularemos la puntuación t relacionada con el nivel de confianza. Estamos obligados a tener exactamente α / 2 de probabilidad en la cola inferior y superior. R proporciona la función qt() mediante la cual podemos calcular el puntaje t fácilmente. La sintaxis se da a continuación,

Sintaxis:

qt(variable_aleatoria, grado_de_libertad) 

Parámetros:

random_variable: Debe ser una variable aleatoria  

grade_of_freedom: Debe ser grado de libertad

R

alpha = 0.05
degrees_of_freedom = sample.n - 1
t_score = qt(p=alpha/2, df=degrees_of_freedom,lower.tail=F)
print(t_score)

Paso 4: Calcule el margen de error y forme el intervalo de confianza.

El margen de error está dado por,

/ 2,N – 1 S

Se puede calcular fácilmente como,

R

margin_error <- t_score * standard_error

El intervalo de confianza es igual a la media +/- margen de error. Se puede calcular como,

R

# Calculate the lower bound 
lower_bound <- mean_value - margin_error
 
# Calculate the upper bound
upper_bound <- mean_value + margin_error

Combinando todos los pasos

Ejemplo:

R

# R program to find the confidence interval
 
# Calculate the mean of the sample data
mean_value <- mean(iris$Sepal.Length)
 
# Compute the size
n <- length(iris$Sepal.Length)
 
# Find the standard deviation
standard_deviation <- sd(iris$Sepal.Length)
 
# Find the standard error
standard_error <- standard_deviation / sqrt(n)
alpha = 0.05
degrees_of_freedom = n - 1
t_score = qt(p=alpha/2, df=degrees_of_freedom,lower.tail=F)
margin_error <- t_score * standard_error
 
# Calculating lower bound and upper bound
lower_bound <- mean_value - margin_error
upper_bound <- mean_value + margin_error
 
# Print the confidence interval
print(c(lower_bound,upper_bound))

Producción:

Método 2: Cálculo de intervalos de confianza usando la función confit()

Podemos calcular el intervalo de confianza usando las funciones incorporadas en R. Los pasos se dan a continuación,

Paso 1: Cálculo de la media y el error estándar.

R nos proporciona la función lm() que se utiliza para ajustar modelos lineales en marcos de datos. Podemos calcular la media y el error estándar (que se requieren para encontrar el intervalo de confianza) usando esta función. La sintaxis se da a continuación,   

Sintaxis:

lm(fórmula_de_ajuste, marco de datos)

Parámetros:

fitting_formula: Debe ser la fórmula del modelo lineal.

dataframe: Debe ser el nombre del data frame que contiene los datos.

R

# Calculate the mean and standard error
l_model <- lm(Sepal.Length ~ 1, iris)

Paso 2: Encontrar el intervalo de confianza.

Ahora, para encontrar el intervalo de confianza, tenemos la función confint() en R. Esta función se usa específicamente para calcular los intervalos de confianza para uno o más parámetros en un modelo ajustado. La sintaxis se da a continuación,

Sintaxis:

confint(objeto, parámetro, nivel = 0.95, …)

Parámetros:

objeto: Representa el objeto modelo ajustado.

parm : Representa parámetros a los que se les darán intervalos de confianza (ya sea un vector)

level : Representa el nivel de confianza.

… : Representa un argumento adicional para diferentes métodos.

R

# Find the confidence interval
 
confint(model, level=0.95)

Combinando todos los pasos

Ejemplo:

R

# R program to find the confidence interval
 
# Calculate the mean and standard error
model <- lm(Sepal.Length ~ 1, iris)
 
# Find the confidence interval
confint(model, level=0.95)

Producción:

Publicación traducida automáticamente

Artículo escrito por bhuwanesh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *