En cuanto a las funciones estadísticas , la mediana de un conjunto de datos es la medida de tendencia central robusta, que se ve menos afectada por la presencia de valores atípicos en los datos. Como se vio anteriormente, las medianas de un conjunto de datos no agrupados usan las funciones mediana() , mediana_alta() , mediana_baja() .
Python también ofrece la opción de calcular la mediana de la función de datos continuos y agrupados, y esta es la mejor parte de este lenguaje robusto y conveniente. La función mediana_agrupada() del módulo Estadísticas ayuda a calcular el valor de la mediana a partir de un conjunto de datos continuos.
Se supone que los datos se agrupan en intervalos de intervalos de ancho. Cada punto de datos en la array es el punto medio del intervalo que contiene el valor verdadero. La mediana se calcula por interpolación dentro del intervalo de la mediana (el intervalo que contiene el valor de la mediana), asumiendo que los valores verdaderos dentro de ese intervalo se distribuyen uniformemente:
median = L + interval * (N / 2 - CF) / FL = lower limit of the median interval N = total number of data points CF = number of data points below the median interval F = number of data points in the median interval
Sintaxis: mediana_agrupada ([conjunto de datos], intervalo)
Parámetros:
[conjunto de datos]: lista o tupla o iterable con un conjunto de valores numéricos.
Intervalo (1 por defecto) : Determina el ancho de los datos agrupados y cambiando. También cambiará la interpolación de la mediana calculada.
Returntype: Devuelve la mediana de los datos continuos agrupados, calculados como percentil 50 .
Excepciones: StatisticsError se genera cuando el iterable pasado está vacío o cuando la lista es nula.
Código #1:
Python3
# Python3 code to demonstrate median_grouped() # importing median_grouped from # the statistics module from statistics import median_grouped # creating an simple data-set data1 = [15, 20, 25, 30, 35] # printing median_grouped for the set print("Grouped Median of the median is %s" %(median_grouped(data1)))
Producción :
Grouped Median of the median is 25.0
Código #2: Trabajo de mediana_agrupada en un rango de datos variables
Python3
# Python code to demonstrate the # working of median_grouped() # importing statistics module from statistics import median_grouped # tuple of a set of positive integers set1 = [2, 5, 3, 4, 8, 9] # tuple of a set of negative integers set2 = [-6, -2, -9, -12] # tuple of a set of positive # and negative integers set3 = [2, 4, 8, 9, -2, -3, -5, -6] # Printing grouped median for # the given set of data print("Grouped Median of set 1 is % s" % (median_grouped(set1))) print("Grouped Median of set 2 is % s" % (median_grouped(set2))) print("Grouped Median of set 3 is % s" % (median_grouped(set3)))
Producción :
Grouped Median of set 1 is 4.5 Grouped Median of set 2 is -6.5 Grouped Median of set 3 is 1.5
Código #3: Trabajo de intervalo
Python3
# Python code to demonstrate the working of # interval in median_grouped() function # importing statistics module from statistics import median_grouped # creating a tuple of simple data set1 = (10, 12, 13, 12, 13, 15) # Printing median_grouped() # keeping default interval at 1 print("Grouped Median for Interval set as "\ "(default) 1 is % s" %(median_grouped(set1))) # For interval value of 2 print("Grouped Median for Interval set as "\ "2 is % s" %(median_grouped(set1, interval = 2))) # Now for interval value of 5 print("Grouped Median for Interval set as "\ "5 is % s" %(median_grouped(set1, interval = 5)))
Producción :
Grouped Median for Interval set as (default) 1 is 12.5 Grouped Median for Interval set as 2 is 12.0 Grouped Median for Interval set as 5 is 10.5 Grouped Median for Interval set as 10 is 8.0
Nota: observe un patrón en el que, a medida que aumenta el valor del intervalo, disminuye el valor de la mediana.
Código #4: Demuestra un error estadístico
Python3
# Python code to demonstrate StatisticsError # importing the statistics module import statistics # creating an empty dataset list1 = [] # Will raise StatisticsError print(statistics.median_grouped(list1))
Producción :
Traceback (most recent call last): File "/home/0990a4a3f5206c7cd12a596cf82a1587.py", line 10, in print(statistics.median_grouped(list1)) File "/usr/lib/python3.5/statistics.py", line 431, in median_grouped raise StatisticsError("no median for empty data") statistics.StatisticsError: no median for empty data
Aplicaciones:
La mediana agrupada tiene todas las mismas aplicaciones que la mediana. Se usa comúnmente en cálculos donde se involucra una gran cantidad de datos, como banca y finanzas. Es una parte esencial de las estadísticas, que es la herramienta más poderosa en el cálculo de datos.