En este artículo, veremos el enfoque para realizar una prueba F en el lenguaje de programación python. La función scipy stats.f() en Python con ciertos parámetros necesarios para obtener la prueba F de los datos proporcionados.
scipy stats.f(): Es una variable aleatoria continua F que se define con un formato estándar y unos parámetros de forma para completar su especificación.
Sintaxis: scipy stats.f()
Parámetros:
- x : cuantiles
- q : probabilidad de cola inferior o superior
- parámetros de forma dfn, dfd
- loc: parámetro de ubicación
- scale : parámetro de escala (predeterminado=1)
- tamaño: forma de variación aleatoria
- momentos: compuesto de letras [‘mvsk’] que especifican qué momentos calcular
En este ejemplo, usaremos los datos de la muestra distribuida normalizada y con los diferentes valores de varianza y usaremos además scipy.stats.f.cdf() para obtener la prueba F de los datos en el lenguaje de programación python.
Python
import numpy as np import scipy.stats # Create data group1 = [0.28, 0.2, 0.26, 0.28, 0.5] group2 = [0.2, 0.23, 0.26, 0.21, 0.23] # converting the list to array x = np.array(group1) y = np.array(group2) # calculate variance of each group print(np.var(group1), np.var(group2)) def f_test(group1, group2): f = np.var(group1, ddof=1)/np.var(group2, ddof=1) nun = x.size-1 dun = y.size-1 p_value = 1-scipy.stats.f.cdf(f, nun, dun) return f, p_value # perform F-test f_test(x, y)
Producción:
0.010464 0.00042400000000000017— Variaciones
(24.679245283018858, 0.004431318383760985) –Valores de prueba F
Interpretación de la prueba:
El estadístico de la prueba F es 24,67 y el valor p es 0,0044, rechazaríamos la hipótesis nula valor asp<=0,05, por lo que podemos decir simplemente observando el valor p de los datos utilizados que las dos varianzas poblacionales no son iguales.
Publicación traducida automáticamente
Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA