El módulo de estadísticas proporciona herramientas muy poderosas, que se pueden usar para calcular cualquier cosa relacionada con las estadísticas. variance() es una de esas funciones. Esta función ayuda a calcular la varianza de una muestra de datos (la muestra es un subconjunto de datos poblados).
La función variance() solo debe usarse cuando se necesita calcular la varianza de una muestra. Hay otra función conocida como pvariance(), que se usa para calcular la varianza de una población completa.
En estadística pura, la varianza es la desviación al cuadrado de una variable de su media. Básicamente, mide la dispersión de datos aleatorios en un conjunto a partir de su valor medio o mediano. Un valor bajo para la varianza indica que los datos están agrupados y no están muy separados, mientras que un valor alto indicaría que los datos en el conjunto dado están mucho más separados del valor promedio.
La varianza es una herramienta importante en las ciencias, donde el análisis estadístico de datos es común. Es el cuadrado de la desviación estándar del conjunto de datos dado y también se conoce como segundo momento central de una distribución. Suele estar representado por en Estadística pura.
La varianza se calcula mediante la siguiente fórmula:
Se calcula por la media del cuadrado menos el cuadrado de la media
Sintaxis: varianza ([datos], xbarra)
Parámetros:
[datos]: un iterable con números de valor real.
xbar (opcional): toma la media real del conjunto de datos como valor.
Returnype: Devuelve la varianza real de los valores pasados como parámetro.
Excepciones: se genera
StatisticsError para conjuntos de datos de menos de 2 valores pasados como parámetro.
Lanza valores imposibles cuando el valor proporcionado como xbar no coincide con la media real del conjunto de datos.
Código #1:
Python3
# Python code to demonstrate the working of # variance() function of Statistics Module # Importing Statistics module import statistics # Creating a sample of data sample = [2.74, 1.23, 2.63, 2.22, 3, 1.98] # Prints variance of the sample set # Function will automatically calculate # it's mean and set it as xbar print("Variance of sample set is % s" %(statistics.variance(sample)))
Producción :
Variance of sample set is 0.40924
Código #2: Demuestra varianza() en un rango de tipos de datos
Python3
# Python code to demonstrate variance() # function on varying range of data-types # importing statistics module from statistics import variance # importing fractions as parameter values from fractions import Fraction as fr # tuple of a set of positive integers # numbers are spread apart but not very much sample1 = (1, 2, 5, 4, 8, 9, 12) # tuple of a set of negative integers sample2 = (-2, -4, -3, -1, -5, -6) # tuple of a set of positive and negative numbers # data-points are spread apart considerably sample3 = (-9, -1, -0, 2, 1, 3, 4, 19) # tuple of a set of fractional numbers sample4 = (fr(1, 2), fr(2, 3), fr(3, 4), fr(5, 6), fr(7, 8)) # tuple of a set of floating point values sample5 = (1.23, 1.45, 2.1, 2.2, 1.9) # Print the variance of each samples print("Variance of Sample1 is % s " %(variance(sample1))) print("Variance of Sample2 is % s " %(variance(sample2))) print("Variance of Sample3 is % s " %(variance(sample3))) print("Variance of Sample4 is % s " %(variance(sample4))) print("Variance of Sample5 is % s " %(variance(sample5)))
Producción :
Variance of Sample 1 is 15.80952380952381 Variance of Sample 2 is 3.5 Variance of Sample 3 is 61.125 Variance of Sample 4 is 1/45 Variance of Sample 5 is 0.17613000000000006
Código #3: Demuestra el uso del parámetro xbar
Python3
# Python code to demonstrate # the use of xbar parameter # Importing statistics module import statistics # creating a sample list sample = (1, 1.3, 1.2, 1.9, 2.5, 2.2) # calculating the mean of sample set m = statistics.mean(sample) # calculating the variance of sample set print("Variance of Sample set is % s" %(statistics.variance(sample, xbar = m)))
Producción :
Variance of Sample set is 0.3656666666666667
Código #4: Demuestra el error cuando el valor de xbar no es el mismo que el valor medio/promedio
Python3
# Python code to demonstrate the error caused # when garbage value of xbar is entered # Importing statistics module import statistics # creating a sample list sample = (1, 1.3, 1.2, 1.9, 2.5, 2.2) # calculating the mean of sample set m = statistics.mean(sample) # Actual value of mean after calculation # comes out to 1.6833333333333333 # But to demonstrate xbar error let's enter # -100 as the value for xbar parameter print(statistics.variance(sample, xbar = -100))
Producción :
0.3656666666663053
Nota: es diferente en precisión de la salida en el código n.° 3.
Código n.° 4: demuestra un error estadístico.
Python3
# Python code to demonstrate StatisticsError # importing Statistics module import statistics # creating an empty data-srt sample = [] # will raise Statistics Error print(statistics.variance(sample))
Producción :
Traceback (most recent call last): File "/home/64bf6d80f158b65d2b75c894d03a7779.py", line 10, in print(statistics.variance(sample)) File "/usr/lib/python3.5/statistics.py", line 555, in variance raise StatisticsError('variance requires at least two data points') statistics.StatisticsError: variance requires at least two data points
Aplicaciones:
la varianza es una herramienta muy importante en estadística y en el manejo de grandes cantidades de datos. Por ejemplo, cuando se desconoce la media omnisciente (media de la muestra), la varianza se usa como estimador sesgado. Las observaciones del mundo real, como el valor de aumento y disminución de todas las acciones de una empresa a lo largo del día, no pueden ser todos los conjuntos de observaciones posibles. Como tal, la varianza se calcula a partir de un conjunto finito de datos, aunque no coincidirá cuando se calcule teniendo en cuenta a toda la población, pero aún así le dará al usuario una estimación que es suficiente para realizar otros cálculos.