La moda de un conjunto de valores de datos es el valor que aparece con mayor frecuencia . Es el valor en el que es más probable que se muestreen los datos. A menudo se considera que una moda de una distribución de probabilidad continua es cualquier valor x en el que su función de densidad de probabilidad tiene un valor máximo local, por lo que cualquier pico es una moda.
Python es muy robusto cuando se trata de estadísticas y de trabajar con un conjunto de una amplia gama de valores. El módulo de estadísticas tiene una gran cantidad de funciones para trabajar con conjuntos de datos muy grandes. La función mode() es uno de esos métodos. Esta función devuelve la medida robusta de un punto de datos central en un rango dado de conjuntos de datos.
Ejemplo :
Given data-set is : [1, 2, 3, 4, 4, 4, 4, 5, 6, 7, 7, 7, 8] The mode of the given data-set is 4 Logic: 4 is the most occurring/ most common element from the given list
Syntax : mode([data-set]) Parameters : [data-set] which is a tuple, list or a iterator of real valued numbers as well as Strings. Return type : Returns the most-common data point from discrete or nominal data. Errors and Exceptions : Raises StatisticsError when data set is empty.
Código #1: Esta pieza demostrará la función mode() a través de un ejemplo simple.
Python3
# Python code to demonstrate the # use of mode() function # mode() function a sub-set of the statistics module # We need to import the statistics module before doing any work import statistics # declaring a simple data-set consisting of real valued # positive integers. set1 =[1, 2, 3, 3, 4, 4, 4, 5, 5, 6] # In the given data-set # Count of 1 is 1 # Count of 2 is 1 # Count of 3 is 2 # Count of 4 is 3 # Count of 5 is 2 # Count of 6 is 1 # We can infer that 4 has the highest population distribution # So mode of set1 is 4 # Printing out mode of given data-set print("Mode of given data set is % s" % (statistics.mode(set1)))
Mode of given data set is 4
Código #2: En este código demostraremos la función mode() en una variedad de conjuntos de datos.
Python3
# Python code to demonstrate the # working of mode() function # on a various range of data types # Importing the statistics module from statistics import mode # Importing fractions module as fr # Enables to calculate harmonic_mean of a # set in Fraction from fractions import Fraction as fr # tuple of positive integer numbers data1 = (2, 3, 3, 4, 5, 5, 5, 5, 6, 6, 6, 7) # tuple of a set of floating point values data2 = (2.4, 1.3, 1.3, 1.3, 2.4, 4.6) # tuple of a set of fractional numbers data3 = (fr(1, 2), fr(1, 2), fr(10, 3), fr(2, 3)) # tuple of a set of negative integers data4 = (-1, -2, -2, -2, -7, -7, -9) # tuple of strings data5 = ("red", "blue", "black", "blue", "black", "black", "brown") # Printing out the mode of the above data-sets print("Mode of data set 1 is % s" % (mode(data1))) print("Mode of data set 2 is % s" % (mode(data2))) print("Mode of data set 3 is % s" % (mode(data3))) print("Mode of data set 4 is % s" % (mode(data4))) print("Mode of data set 5 is % s" % (mode(data5)))
Mode of data set 1 is 5 Mode of data set 2 is 1.3 Mode of data set 3 is 1/2 Mode of data set 4 is -2 Mode of data set 5 is black
Código n.º 3: en este fragmento de código se demostrará cuándo se genera StatisticsError
Python3
# Python code to demonstrate the # statistics error in mode function ''' StatisticsError is raised while using mode when there are two equal modes present in a data set and when the data set is empty or null ''' # importing statistics module import statistics # creating a data set consisting of two equal data-sets data1 =[1, 1, 1, -1, -1, -1] # In the above data set # Count of 1 is 3 # Count of -1 is also 3 # StatisticsError will be raised print(statistics.mode(data1))
Producción
Traceback (most recent call last): File "/home/38fbe95fe09d5f65aaa038e37aac20fa.py", line 20, in print(statistics.mode(data1)) File "/usr/lib/python3.5/statistics.py", line 474, in mode raise StatisticsError('no mode for empty data') from None statistics.StatisticsError: no mode for empty data
NOTA: En las versiones más nuevas de Python, como Python 3.8, el concepto matemático real se aplicará cuando haya múltiples modos para una secuencia, donde el elemento más pequeño se considera un modo.
Digamos, para el código anterior, las frecuencias de -1 y 1 son las mismas, sin embargo, -1 será la moda, debido a su valor más pequeño.
Aplicaciones: El modo() es una función estadística y se usa principalmente en los sectores financieros para comparar valores/precios con detalles pasados, calcular/predecir precios futuros probables a partir de un conjunto de distribución de precios. mean() no se usa por separado, pero junto con otros dos pilares de estadísticas, la media y la mediana crean una herramienta muy poderosa que se puede usar para revelar cualquier aspecto de sus datos.