Distribución beta en R

Una distribución en estadística es una función que muestra los posibles valores de una variable y con qué frecuencia ocurren en un experimento o conjunto de datos en particular. La distribución beta es un tipo de distribución de probabilidad que representa todos los resultados posibles del conjunto de datos. La distribución beta básicamente muestra la probabilidad de probabilidades, donde α y β pueden tomar cualquier valor que dependa de la probabilidad de éxito/fracaso.

La fórmula general para la función de densidad de probabilidad de la distribución beta es:

f(x)=\frac{(x-a)^{p-1}(b-x)^{q-1}}{B(p,q)(b-a)^{p+q-1})}\hspace{.3in} a \le x \le b; p, q > 0.

dónde ,

  • p y q son los parámetros de forma
  • a y b son límite inferior y superior
  • a≤x≤b
  • pq>0
  • B(p,q) es la función beta

Para comprender específicamente la distribución beta en R, aprenderemos sobre las funciones beta. La función Beta es un componente de la distribución beta (la función beta en R se puede implementar mediante la función beta (a,b)) que incluye estos dbeta, pbeta, qbeta y rbeta, que son las funciones de la distribución Beta.

La función beta se define como:

B(\alpha ,\beta )=\int_{0}^{1} t^{^{\alpha -1}}(1-t)^{\beta } dt

El caso en el que a = 0 y b = 1 se denomina distribución beta estándar. Por lo tanto, la distribución beta estándar es:

f(x)=\frac{(x)^{p-1}(1-x)^{q-1}}{B(p,q)}  \displaystyle \propto {(x)^{p-1}}{(1-x)^{q-1}}\hspace{.3in} 0 \le x \le 1; p, q > 0.

A través de la distribución beta, también podemos conocer las medidas de tendencia central como la media, la moda mediana y también las medidas de dispersión estadística como la varianza.

¿Por qué Distribución Beta?

Por qué en realidad podríamos querer elegir la distribución beta para especificar el conocimiento previo sobre theta, una de las principales razones es que esta distribución se define en el rango de [0,1], por lo que una distribución beta es una distribución muy natural para usar cuando Estamos hablando de probabilidades y queremos especificar sobre un conocimiento previo de las probabilidades de que algo se acumule.

Rango de creencias en la Distribución Beta 

El rango de creencias es que podemos definir un gran conjunto de un rango bastante grande cambiando los parámetros de p y q, es decir, parámetros de forma.

Pongamos un ejemplo para entenderlo mejor.

S.no. pags q

1

0.5 0.5

2

0.5 1

3

1 1

4

3 3

Empecemos cuando tanto p como q sean 0,5. Ponemos 1/2 en esta ecuación:

f(x)={(x)^{p-1}}{(1-x)^{q-1}}\hspace{.3in} 0 \le x \le 1; p, q > 0.

Después de esto se convierte f(x | p,q)  = {(x)^{-1/2}(1-x)^{-1/2}}\hspace{.3in} 0 \le x \le 1; p, q > 0.             

entonces también podemos escribir esta ecuación como:

 f(x |p,q) = \frac {1}{(x)^{1/2}(1-x)^{1/2}}\hspace{.3in} 0 \le x \le 1; p, q > 0.

Por lo tanto, de la ecuación anterior observamos que si x se vuelve cero o 1, entonces tenemos infinito. Luego calcularemos los puntos para todos los valores de p y q. La PDF (función de distribución de probabilidad) de la distribución Beta se puede formar en tres formas a partir de las observaciones anteriores: en forma de U con extremos asintóticos, en forma de campana, estrictamente crecientes/decrecientes o incluso líneas rectas. A medida que cambia el valor de p o q, cambia la forma de la distribución. 

Por lo tanto, el gráfico se verá así:

Ahora, tracemos las funciones de distribución Beta en R para entenderlas mejor. En primer lugar, trace la Densidad Beta y luego todas las demás funciones.

Densidad beta

Para trazar la densidad beta, ya que sabemos que estará entre el rango de (0,1). Estamos usando una función dbeta y plot en la trama.

 Sintaxis: dbeta(valoresx,alfa,beta)

Ejemplo 1: Aquí, podemos observar el gráfico para la densidad beta (1,1) donde podemos observar la distribución uniforme entre 0 y 1.

R

# Creating the Sequence
gfg = seq(0, 1, by = 0.1)
 
# Plotting the beta density
plot(gfg, dbeta(gfg, 1,1), xlab="X",
     ylab = "Beta Density", type = "l",
     col = "Red")

Producción:

Gráfico para densidad beta (1,1)

Ejemplo 2: aquí, podemos observar el gráfico para la densidad beta (2,1), donde podemos observar una función linealmente creciente. En el gráfico anterior, podemos ver que es más probable que los puntos estén cerca de 1 que de 0 y que suban. de manera proporcional. Si simplemente cambiamos la gráfica de (2,1) a (1,2), podemos ver que es más probable que los puntos estén cerca de 0 que de 1.

R

# Creating the Sequence
gfg = seq(0,1, by=0.1)
 
# Case 2
plot(gfg, dbeta(gfg, 2,1), xlab="X",
     ylab = "Beta Density", type = "l",
     col = "Red")

Producción:

Parcela de densidad beta (2,1)  

Ejemplo 3: Aquí, podemos observar el Gráfico de Densidad Beta (2,2) donde podemos observar los valores de la función cuadrática entre casi 0 y 1, pero lo más probable es que tengan un valor cercano a 1/2.

R

# Creating the Sequence
gfg = seq(0,1, by=0.1)
 
# Case 3
plot(gfg, dbeta(gfg, 2,2), xlab = "X",
     ylab = "Beta Density", type = "l",
     col = "Red")

Producción:

Parcela para densidad beta (2,2) 

Funciones distributivas acumulativas

Puede consultar este enlace sobre las funciones de las funciones de distribución beta .

Aquí, en nuestro caso, los datos que tenemos muestran el promedio que puede tomar cualquier valor numérico entre 0 y 1, como puede ver, 0,1 son parámetros en secuencia en la línea n. ° 3 en el código anterior, por lo que a través de la distribución beta, nosotros representan una distribución continua acotada con valores entre 0 y 1, y principalmente modelan la incertidumbre sobre la probabilidad de éxito de un experimento aleatorio, que en nuestro caso, es la probabilidad de que las probabilidades tengan un promedio particular.

Por ello, suele utilizarse en problemas de incertidumbre asociados a proporciones, frecuencias o porcentajes.

R

# The Beta Distribution
plr.data <- data.frame(
  player_avg <- c(seq(0, 1, by = 0.025)),
  stringsAsFactors = FALSE
)
 
# Print the data frame.           
print(plr.data)
print(plr.data$player_avg)
by1 <- dbeta(plr.data$player_avg, shape1 = 5, shape2 = 8)
par(mar = rep(2,4))
plot(by1)
 
# Cummilative distribution function
by2<- pbeta(plr.data$player_avg, shape1 = 4, shape2 = 6)
par(mar = rep(2,4))
plot(by2)
 
# Inverse Cummilative distribution function
by3 <- qbeta(plr.data$player_avg, shape1 = 4, shape2 = 6)
par(mar = rep(2,4))
plot(by3)
 
b4 <- rbeta(plr.data$player_avg, shape1 = 5, shape2 = 8)
par(mar = rep(2,4))
plot(density(b4), main = "Rbeta Plot")

Producción:

Publicación traducida automáticamente

Artículo escrito por yashisrivastav y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *