función mode() en el módulo de estadísticas de Python

La moda de un conjunto de valores de datos es el valor que aparece con mayor frecuencia . Es el valor en el que es más probable que se muestreen los datos. A menudo se considera que una moda de una distribución de probabilidad continua es cualquier valor x en el que su función de densidad de probabilidad tiene un valor máximo local, por lo que cualquier pico es una moda.
Python es muy robusto cuando se trata de estadísticas y de trabajar con un conjunto de una amplia gama de valores. El módulo de estadísticas tiene una gran cantidad de funciones para trabajar con conjuntos de datos muy grandes. La función mode() es uno de esos métodos. Esta función devuelve la medida robusta de un punto de datos central en un rango dado de conjuntos de datos.

Ejemplo : 

Given data-set is :  [1, 2, 3, 4, 4, 4, 4, 5, 6, 7, 7, 7, 8]
The mode of the given data-set is 4
Logic: 4 is the most occurring/ most common element from the given list 
Syntax :
mode([data-set])
Parameters : 
[data-set] which is a tuple, list or a iterator of 
real valued numbers as well as Strings.
Return type : 
Returns the most-common data point from discrete or nominal data.
Errors and Exceptions : 
Raises StatisticsError when data set is empty.

Código #1: Esta pieza demostrará la función mode() a través de un ejemplo simple. 

Python3

# Python code to demonstrate the
# use of mode() function
 
# mode() function a sub-set of the statistics module
# We need to import the statistics module before doing any work
import statistics
 
# declaring a simple data-set consisting of real valued
# positive integers.
set1 =[1, 2, 3, 3, 4, 4, 4, 5, 5, 6]
 
# In the given data-set
# Count of 1 is 1
# Count of 2 is 1
# Count of 3 is 2
# Count of 4 is 3
# Count of 5 is 2
# Count of 6 is 1
# We can infer that 4 has the highest population distribution
# So mode of set1 is 4
 
# Printing out mode of given data-set
print("Mode of given data set is % s" % (statistics.mode(set1)))
Producción

Mode of given data set is 4

Código #2: En este código demostraremos la función mode() en una variedad de conjuntos de datos. 

Python3

# Python code to demonstrate the
# working of mode() function
# on a various range of data types
 
# Importing the statistics module
from statistics import mode
 
# Importing fractions module as fr
# Enables to calculate harmonic_mean of a
# set in Fraction
from fractions import Fraction as fr
 
# tuple of positive integer numbers
data1 = (2, 3, 3, 4, 5, 5, 5, 5, 6, 6, 6, 7)
 
# tuple of a set of floating point values
data2 = (2.4, 1.3, 1.3, 1.3, 2.4, 4.6)
 
# tuple of a set of fractional numbers
data3 = (fr(1, 2), fr(1, 2), fr(10, 3), fr(2, 3))
 
# tuple of a set of negative integers
data4 = (-1, -2, -2, -2, -7, -7, -9)
 
# tuple of strings
data5 = ("red", "blue", "black", "blue", "black", "black", "brown")
 
 
# Printing out the mode of the above data-sets
print("Mode of data set 1 is % s" % (mode(data1)))
print("Mode of data set 2 is % s" % (mode(data2)))
print("Mode of data set 3 is % s" % (mode(data3)))
print("Mode of data set 4 is % s" % (mode(data4)))
print("Mode of data set 5 is % s" % (mode(data5)))
Producción

Mode of data set 1 is 5
Mode of data set 2 is 1.3
Mode of data set 3 is 1/2
Mode of data set 4 is -2
Mode of data set 5 is black

Código n.º 3: en este fragmento de código se demostrará cuándo se  genera StatisticsError

Python3

# Python code to demonstrate the 
# statistics error in mode function
   
'''
StatisticsError is raised while using mode when there are
two equal modes present in a data set and when the data set
is empty or null
'''
   
# importing statistics module
import statistics
   
# creating a data set consisting of two equal data-sets
data1 =[1, 1, 1, -1, -1, -1]
   
# In the above data set
# Count of 1 is 3
# Count of -1 is also 3
# StatisticsError will be raised
   
print(statistics.mode(data1))

Producción 

Traceback (most recent call last):
  File "/home/38fbe95fe09d5f65aaa038e37aac20fa.py", line 20, in 
    print(statistics.mode(data1))
  File "/usr/lib/python3.5/statistics.py", line 474, in mode
    raise StatisticsError('no mode for empty data') from None
statistics.StatisticsError: no mode for empty data

NOTA: En las versiones más nuevas de Python, como Python 3.8, el concepto matemático real se aplicará cuando haya múltiples modos para una secuencia, donde el elemento más pequeño se considera un modo.

Digamos, para el código anterior, las frecuencias de -1 y 1 son las mismas, sin embargo, -1 será la moda, debido a su valor más pequeño.

Aplicaciones: El modo() es una función estadística y se usa principalmente en los sectores financieros para comparar valores/precios con detalles pasados, calcular/predecir precios futuros probables a partir de un conjunto de distribución de precios. mean() no se usa por separado, pero junto con otros dos pilares de estadísticas, la media y la mediana crean una herramienta muy poderosa que se puede usar para revelar cualquier aspecto de sus datos. 
 

Publicación traducida automáticamente

Artículo escrito por retr0 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *