Estadísticas de Python | diferencia()

El módulo de estadísticas proporciona herramientas muy poderosas, que se pueden usar para calcular cualquier cosa relacionada con las estadísticas. variance() es una de esas funciones. Esta función ayuda a calcular la varianza de una muestra de datos (la muestra es un subconjunto de datos poblados). 
La función variance() solo debe usarse cuando se necesita calcular la varianza de una muestra. Hay otra función conocida como pvariance(), que se usa para calcular la varianza de una población completa.
En estadística pura, la varianza es la desviación al cuadrado de una variable de su media. Básicamente, mide la dispersión de datos aleatorios en un conjunto a partir de su valor medio o mediano. Un valor bajo para la varianza indica que los datos están agrupados y no están muy separados, mientras que un valor alto indicaría que los datos en el conjunto dado están mucho más separados del valor promedio. 
La varianza es una herramienta importante en las ciencias, donde el análisis estadístico de datos es común. Es el cuadrado de la desviación estándar del conjunto de datos dado y también se conoce como segundo momento central de una distribución. Suele estar representado por  s^{2}, \sigma ^{2}, \operatorname {Var} (X) en Estadística pura.
La varianza se calcula mediante la siguiente fórmula: 
 

Se calcula por la media del cuadrado menos el cuadrado de la media
\operatorname {Var} (X)=\operatorname {E} \left[(X-\mu )^{2}\right]
 

Sintaxis: varianza ([datos], xbarra)
Parámetros: 
[datos]: un iterable con números de valor real. 
xbar (opcional): toma la media real del conjunto de datos como valor.
Returnype: Devuelve la varianza real de los valores pasados ​​como parámetro.
Excepciones:  se genera 
StatisticsError para conjuntos de datos de menos de 2 valores pasados ​​como parámetro.
Lanza valores imposibles cuando el valor proporcionado como xbar no coincide con la media real del conjunto de datos. 
 

Código #1:
 

Python3

# Python code to demonstrate the working of
# variance() function of Statistics Module
 
# Importing Statistics module
import statistics
 
# Creating a sample of data
sample = [2.74, 1.23, 2.63, 2.22, 3, 1.98]
 
# Prints variance of the sample set
 
# Function will automatically calculate
# it's mean and set it as xbar
print("Variance of sample set is % s"
      %(statistics.variance(sample)))

Producción : 
 

Variance of sample set is 0.40924

  
Código #2: Demuestra varianza() en un rango de tipos de datos 
 

Python3

# Python code to demonstrate variance()
# function on varying range of data-types
 
# importing statistics module
from statistics import variance
 
# importing fractions as parameter values
from fractions import Fraction as fr
 
# tuple of a set of positive integers
# numbers are spread apart but not very much
sample1 = (1, 2, 5, 4, 8, 9, 12)
 
# tuple of a set of negative integers
sample2 = (-2, -4, -3, -1, -5, -6)
 
# tuple of a set of positive and negative numbers
# data-points are spread apart considerably
sample3 = (-9, -1, -0, 2, 1, 3, 4, 19)
 
# tuple of a set of fractional numbers
sample4 = (fr(1, 2), fr(2, 3), fr(3, 4),
                     fr(5, 6), fr(7, 8))
 
# tuple of a set of floating point values
sample5 = (1.23, 1.45, 2.1, 2.2, 1.9)
 
# Print the variance of each samples
print("Variance of Sample1 is % s " %(variance(sample1)))
print("Variance of Sample2 is % s " %(variance(sample2)))
print("Variance of Sample3 is % s " %(variance(sample3)))
print("Variance of Sample4 is % s " %(variance(sample4)))
print("Variance of Sample5 is % s " %(variance(sample5)))

Producción : 
 

Variance of Sample 1 is 15.80952380952381 
Variance of Sample 2 is 3.5 
Variance of Sample 3 is 61.125 
Variance of Sample 4 is 1/45 
Variance of Sample 5 is 0.17613000000000006 

  
Código #3: Demuestra el uso del parámetro xbar 
 

Python3

# Python code to demonstrate
# the use of xbar parameter
 
# Importing statistics module
import statistics
 
# creating a sample list
sample = (1, 1.3, 1.2, 1.9, 2.5, 2.2)
 
# calculating the mean of sample set
m = statistics.mean(sample)
 
 
# calculating the variance of sample set
print("Variance of Sample set is % s"
    %(statistics.variance(sample, xbar = m)))

Producción : 
 

Variance of Sample set is 0.3656666666666667

  
Código #4: Demuestra el error cuando el valor de xbar no es el mismo que el valor medio/promedio 
 

Python3

# Python code to demonstrate the error caused
# when garbage value of xbar is entered
 
# Importing statistics module
import statistics
 
# creating a sample list
sample = (1, 1.3, 1.2, 1.9, 2.5, 2.2)
 
# calculating the mean of sample set
m = statistics.mean(sample)
 
# Actual value of mean after calculation
# comes out to 1.6833333333333333
# But to demonstrate xbar error let's enter
# -100 as the value for xbar parameter
print(statistics.variance(sample, xbar = -100))

Producción : 
 

0.3656666666663053

Nota: es diferente en precisión de la salida en el código n.° 3. 
  
Código n.° 4: demuestra un error estadístico. 
 

Python3

# Python code to demonstrate StatisticsError
 
# importing Statistics module
import statistics
 
# creating an empty data-srt
sample = []
 
# will raise Statistics Error
print(statistics.variance(sample))

Producción : 
 

Traceback (most recent call last):
  File "/home/64bf6d80f158b65d2b75c894d03a7779.py", line 10, in 
    print(statistics.variance(sample))
  File "/usr/lib/python3.5/statistics.py", line 555, in variance
    raise StatisticsError('variance requires at least two data points')
statistics.StatisticsError: variance requires at least two data points

  
Aplicaciones: 
la varianza es una herramienta muy importante en estadística y en el manejo de grandes cantidades de datos. Por ejemplo, cuando se desconoce la media omnisciente (media de la muestra), la varianza se usa como estimador sesgado. Las observaciones del mundo real, como el valor de aumento y disminución de todas las acciones de una empresa a lo largo del día, no pueden ser todos los conjuntos de observaciones posibles. Como tal, la varianza se calcula a partir de un conjunto finito de datos, aunque no coincidirá cuando se calcule teniendo en cuenta a toda la población, pero aún así le dará al usuario una estimación que es suficiente para realizar otros cálculos.
 

Publicación traducida automáticamente

Artículo escrito por retr0 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *