Estadísticas de Python | pvarianza()

Requisito previo: estadísticas de Python | La función variance()
pvariance() ayuda a calcular la varianza de un todo, en lugar de la de una muestra. La única diferencia entre variance() y pvariance() es que cuando se usa variance(), solo se tiene en cuenta la media de la muestra, mientras que con pvariance() se tiene en cuenta la media de toda la población.
La varianza de la población es similar a la varianza de la muestra, indica cómo se distribuyen los puntos de datos en una población específica. Es el promedio de la distancia desde los puntos de datos hasta la media del conjunto de datos, al cuadrado. La varianza de la población es un parámetro de la población y no depende de los métodos de investigación ni de las prácticas de muestreo. 
 

Sintaxis: pvariance ([datos], mu)
Parámetros: 
[datos]: un iterable con números de valor real. 
mu (opcional): toma la media real del conjunto de datos/población como valor.
Returnype: Devuelve la varianza de la población real de los valores pasados ​​como parámetro.
Excepciones: se genera  
StatisticsError para conjuntos de datos de menos de 2 valores pasados ​​como parámetro. 
Valores imposibles cuando el valor proporcionado como mu no coincide con la media real del conjunto de datos. 
 

Código #1:
 

Python3

# Python code to demonstrate the
# use of pvariance()
 
# importing statistics module
import statistics
 
# creating a random population list
population = (1, 1.1, 1.2, 1.3, 1.4, 1.5, 1.9, 2.2,
              2.3, 2.4, 2.6, 2.9, 3.0, 3.4, 3.3, 3.2)
 
 
# Prints the population variance
print("Population variance is %s"
      %(statistics.pvariance(population)))

Producción : 
 

Population variance is 0.6658984375

  
Código #2: Demuestra pvariance() en un rango diferente de árboles de población. 
 

Python3

# Python code to demonstrate pvariance()
# on various range of population sets
 
# importing statistics module
from statistics import pvariance
 
# importing fractions module as F
from fractions import Fraction as F
 
 
# Population tree for a set of positive integers
pop1 = (1, 2, 3, 5, 4, 6, 1, 2, 2, 3, 1, 3,
         7, 8, 9, 1, 1, 1, 2, 6, 7, 8, 9, )
 
# Creating a population tree for
# a set of negative integers
pop2 = (-36, -35, -34, -32, -30, -31, -33, -33, -33,
             -38, -36, -35, -34, -38, -40, -31, -32)
 
# Creating a population tree for
# a set of fractional numbers
pop3 = (F(1, 3), F(2, 4), F(2, 3),
        F(3, 2), F(2, 5), F(2, 2),
        F(1, 1), F(1, 4), F(1, 2), F(2, 1))
 
# Creating a population tree for
# a set of decimal values
pop4 = (3.45, 3.2, 2.5, 4.6, 5.66, 6.43,
        4.32, 4.23, 6.65, 7.87, 9.87, 1.23,
            1.00, 1.45, 10.12, 12.22, 19.88)
 
# Print the population variance for
# the created population trees
print("Population variance of set 1 is % s"
                        %(pvariance(pop1)))
                         
print("Population variance of set 2 is % s"
                        %(pvariance(pop2)))
                         
print("Population variance of set 3 is % s"
                        %(pvariance(pop3)))
                         
print("Population variance of set 4 is % s"
                        %(pvariance(pop4)))

Producción : 
 

Population variance of set 1 is 7.913043478260869
Population variance of set 2 is 7.204152249134948
Population variance of set 3 is 103889/360000
Population variance of set 4 is 21.767923875432526

  
Código #3: Demuestra el uso del parámetro  mu .
 

Python3

# Python code to demonstrate the use
#  of 'mu' parameter on pvariance()
 
# importing statistics module
import statistics
 
# Apparently, the Python interpreter doesn't
# even check whether the value entered for mu
# is the actual mean of data-set or not.
# Thus providing incorrect value would
# lead to impossible answers
 
# Creating a population tree of the
# age of kids in a locality
tree = (1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,
        12, 12, 12, 12, 13, 1, 2, 12, 2, 2,
              2, 3, 4, 5, 5, 5, 5, 6, 6, 6)
 
# Finding the mean of population tree
m = statistics.mean(tree)
 
# Using the mu parameter
# while using pvariance()
print("Population Variance is % s"
      %(statistics.pvariance(tree, mu = m)))

Producción : 
 

Population Variance is 14.30385015608741

  
Código #4: Demostrar la diferencia entre pvariance() y variance() 
 

Python3

# Python code to demonstrate the
# difference between pvariance()
# and variance()
 
# importing statistocs module
import statistics
 
# Population tree and extract
# a sample from it
tree = (1.1, 1.22, .23, .55, .67, 2.33, 2.81,
             1.54, 1.2, 0.2, 0.1, 1.22, 1.61)
 
# Sample extract from population tree
sample = (1.22, .23, .55, .67, 2.33,
               2.81, 1.54, 1.2, 0.2)
 
 
# Print sample variance and as
# well as population variance
print ("Variance of whole popuation is %s"
            %(statistics.pvariance(tree)))
             
print ("Variance of sample from population is %s "
                 % (statistics.variance(sample)))
 
# Print the difference in both population
# variance and sample variance
print("\n")
 
print("Difference in Population variance"
            "and Sample variance is % s"
        %(abs(statistics.pvariance(tree)
        - statistics.variance(sample))))

Producción : 
 

Variance of the whole popuation is 0.6127751479289941
Variance of the sample from population is 0.8286277777777779 

Difference in Population variance and Sample variance is 0.21585262984878373

Nota: podemos ver en el ejemplo anterior que la varianza de la población y la varianza de la muestra no difieren en un valor enorme. 
  
Código #5: Demuestra un error estadístico 
 

Python3

# Python code to demonstrate StatisticsError
 
# importing statistics module
import statistics
 
# creating an empty population set
pop = ()
 
# will raise StatisticsError
print(statistics.pvariance(pop))

Producción : 
 

Traceback (most recent call last):
  File "/home/fa112e1405f09970eeddd48214318a3c.py", line 10, in 
    print(statistics.pvariance(pop))
  File "/usr/lib/python3.5/statistics.py", line 603, in pvariance
    raise StatisticsError('pvariance requires at least one data point')
statistics.StatisticsError: pvariance requires at least one data point

  
Aplicaciones: 
las aplicaciones de la varianza de la población son muy similares a las de la varianza de la muestra, aunque el rango de la varianza de la población es mucho mayor que el de la varianza de la muestra. La varianza de la población solo se debe usar cuando se va a calcular la varianza de una población completa; de lo contrario, para calcular la varianza de una muestra, se prefiere varianza() . La varianza de la población es una herramienta muy importante en estadística y en el manejo de grandes cantidades de datos. Por ejemplo, cuando se desconoce la media omnisciente (media de la muestra), la varianza se usa como estimador sesgado.
 

Publicación traducida automáticamente

Artículo escrito por retr0 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *