Comprender los tipos de medios | Serie 1

Es uno de los conceptos más importantes de la estadística, un tema crucial para aprender Machine Learning. 
 

  • Media aritmética: Es la expectativa matemática de un conjunto discreto de números o promedios. 
    Denotado por , pronunciado como «x-barra». Es la suma de todos los valores discretos del conjunto dividida por el número total de valores del conjunto. 
    La fórmula para calcular la media de n valores – x 1 , x 2 , ….. x n 
     

  • Ejemplo – 
Sequence = {1, 5, 6, 4, 4}

Sum             = 20
n, Total values = 5
Arithmetic Mean = 20/5 = 4
  • Código – 

Python3

# Arithmetic Mean
 
import statistics
 
# discrete set of numbers
data1 = [1, 5, 6, 4, 4]
 
x = statistics.mean(data1)
 
# Mean
print("Mean is :", x)
  • Producción : 
Mean is : 4
  • Media recortada: la media aritmética está influenciada por los valores atípicos (valores extremos) en los datos. Por lo tanto, la media recortada se usa en el momento del preprocesamiento cuando manejamos este tipo de datos en el aprendizaje automático. 
    Es aritmética que tiene una variación, es decir, se calcula eliminando un número fijo de valores ordenados de cada extremo de la secuencia de datos dada y luego calculando la media (promedio) de los valores restantes. 
     

  • Ejemplo – 
     
Sequence = {0, 2, 1, 3}
p        = 0.25

Remaining Sequence  = {2, 1}
n, Total values = 2
Mean = 3/2 = 1.5
  • Código – 

Python3

# Trimmed Mean
 
from scipy import stats
 
# discrete set of numbers
data = [0, 2, 1, 3]
 
x = stats.trim_mean(data, 0.25)
 
# Mean
print("Trimmed Mean is :", x)
  • Producción : 
Trimmed Mean is : 1.5
  • Media ponderada: la media aritmética o la media recortada otorga la misma importancia a todos los parámetros involucrados. Pero cada vez que trabajamos en predicciones de aprendizaje automático, existe la posibilidad de que algunos valores de parámetros tengan más importancia que otros, por lo que asignamos pesos altos a los valores de dichos parámetros. Además, puede existir la posibilidad de que nuestro conjunto de datos tenga un valor de parámetro muy variable, por lo que asignamos pesos menores a los valores de dichos parámetros. 
     

  • Ejemplo – 
Sequence = [0, 2, 1, 3]
Weight   = [1, 0, 1, 1]

Sum (Weight * sequence)  = 0*1 + 2*0 + 1*1 + 3*1
Sum (Weight) = 3
Weighted Mean = 4 / 3 = 1.3333333333333333
  • Código 1 – 

Python3

# Weighted Mean
 
import numpy as np
 
# discrete set of numbers
data = [0, 2, 1, 3]
 
x = np.average(data, weights =[1, 0, 1, 1])
 
# Mean
print("Weighted Mean is :", x)
  • Salida 1: 
Weighted Mean is : 1.3333333333333333
  • Código 2 – 

Python3

# Weighted Mean
 
data = [0, 2, 1, 3]
weights = [1, 0, 1, 1]
 
x = sum(data[i] * weights[i]
    for i in range(len(data))) / sum(weights)
 
 
print ("Weighted Mean is :", x)
  • Salida 2: 
Weighted Mean is : 1.3333333333333333

Publicación traducida automáticamente

Artículo escrito por Mohit Gupta_OMG 🙂 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *