Distribución Chi-Cuadrado en R

La distribución de chi-cuadrado con grados de libertad gl es la distribución calculada sobre las sumas de los cuadrados de variables aleatorias normales estándar independientes gl. Esta distribución se utiliza para el análisis categórico de los datos.

Consideremos X 1 , X 2 ,…, X m como las m variables aleatorias independientes con una distribución normal estándar, entonces la cantidad que sigue la distribución Chi-Cuadrado con m grados de libertad puede evaluarse como se muestra a continuación. La media de esta distribución es m, y su varianza es equivalente a 2*m, respectivamente.

Fórmula:

V = X_1^{2} + X_2^{2} + ... X_m^{2} ~ X_{m}^{2}

función qchisq()

qchisq da la función cuantil. Cuando proporcionamos el valor de ncp = 0, se utiliza el algoritmo para la distribución no central. El valor de este método es equivalente al valor de x en el percentil q-ésimo (inferior.cola = VERDADERO).

Sintaxis:

qchisq(p, df, ncp = 0, cola inferior = VERDADERO, log.p = FALSO)

Parámetro: 

  • p – vector de probabilidades
  • df – grados de libertad 
  • ncp: parámetro de no centralidad (no negativo).
  • log.p – lógico; si es VERDADERO, las probabilidades p se dan como log(p).
  • cola inferior – lógico; si es VERDADERO (predeterminado), las probabilidades son P[X ≤ x], de lo contrario, P[X > x].

Ejemplo: 

R

# defining the degrees of freedom 
free = 5
qchisq(.75, df=free) 

Producción

[1] 6.62568

Esta función también se puede utilizar para calcular el cuantil de un área determinada bajo la curva.

Ejemplo:

R

# defining the degrees of freedom 
free = 5
qchisq(.999, df=free, lower.tail = TRUE)

Producción

[1] 20.51501

función dchisq()

dchisq da la función de densidad. Es decir, se utiliza para calcular la probabilidad acumulada (cola inferior = VERDADERO para cola izquierda, cola inferior = FALSO para cola derecha) de menor o igual que el valor del vector de cuantiles, es decir, q. 

Sintaxis:

dchisq(x, df, ncp = 0, log = FALSO)

Parámetro:

  • x – vector de cuantiles
  • df – grados de libertad
  • ncp: parámetro de no centralidad (no negativo).
  • log.p – lógico; si es VERDADERO, las probabilidades p se dan como log(p).

Ejemplo:

R

# defining degrees of freedom
df = 6
vec <- 1:4
  
print ("Density function values")
  
dchisq(vec, df = df)

Producción

[1] “Valores de la función de densidad” 

[1] 0,03790817 0,09196986 0,12551072 0,13533528

función pchisq()

pchisq da la función de distribución. dchisq(x, df) nos da la probabilidad de χ2 con equivalente a un valor de x cuando el grado de libertad es df. Este método se puede utilizar para calcular el área bajo la curva para los intervalos especificados de la curva χ2 con un número determinado de grados de libertad.

Sintaxis: 

pchisq(q, df, ncp = 0, cola inferior = VERDADERO, log.p = FALSO)

Parámetro:

  • q – vector de cuantiles
  • df – grados de libertad
  • ncp: parámetro de no centralidad (no negativo).
  • log.p – lógico; si es VERDADERO, las probabilidades p se dan como log(p).
  • cola inferior – lógico; si es VERDADERO (predeterminado), las probabilidades son P[X ≤ x], de lo contrario, P[X > x].

Ejemplo:

R

# defining degrees of freedom
df = 5
  
# calculating for the values in the interval [0,5]
print ("Calculating for the values [0,5]")
pchisq(5, df = df,lower.tail = TRUE)
  
# calculating for the values in the interval [5,inf)
print ("Calculating for the values [5,inf)")
pchisq(5, df = df,lower.tail = FALSE)

Producción

[1] “Cálculo para los valores [0,5]” 

[1] 0.5841198 

[1] “Cálculo para los valores [5,inf)” 

[1] 0.4158802

La suma de las curvas bajo ambos intervalos [0,5] y [5,∞) es equivalente a 1.

función rchisq()

rchisq(n, df) devuelve n números aleatorios de la distribución chi-cuadrado. Se trata pues de generar desviaciones aleatorias. 

Sintaxis:

rchisq(n, df, ncp = 0)

Parámetro: 

  • n – número de observaciones. Si longitud(n) > 1, la longitud se toma como el número requerido.
  • df: grados de libertad (no negativos, pero pueden no ser enteros).
  • ncp: parámetro de no centralidad (no negativo).

Ejemplo:

R

# computing values of 50k random values with 5 degrees of freedom
x <- rchisq(50000, df = 5)
  
hist(x, 
     freq = FALSE, 
     xlim = c(0,16), 
     ylim = c(0,0.2))
  
curve(dchisq(x, df = 5), from = 0, to = 15, 
      n = 5000, col= 'red', lwd=2, add = T)

Producción

Publicación traducida automáticamente

Artículo escrito por yashchuahan y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *