Variabilidad: es la dimensión de importación que mide la variación de los datos, es decir, si los datos están dispersos o muy agrupados. También conocido como Dispersión Cuando se trabaja con conjuntos de datos en Machine Learning o Data Science, implica muchos pasos: medición de la varianza, reducción y distinción de la variabilidad aleatoria de la real. identificar fuentes de variabilidad real, tomar decisiones sobre la elección del preprocesamiento o la selección del modelo en base a él.
Términos relacionados con las métricas de variabilidad:
-> Deviation -> Variance -> Standard Deviation -> Mean Absolute Deviation -> Median Absolute Deviation -> Order Statistics -> Range -> Percentile -> Inter-quartile Range
- Desviación: Podemos llamarlo – errores o residuos también. Es la medida de cuán diferentes/dispersos son los valores, del valor central/observado.
Ejemplo :
Sequence : [2, 3, 5, 6, 7, 9] Suppose, Central/Observed Value = 7 Deviation = [-5, -4, -2, -1, 0, 2]
- Varianza (s 2 ): Es la medida más conocida para estimar la variabilidad ya que es la Desviación al Cuadrado. Uno puede llamarlo error cuadrático medio, ya que es el promedio de la desviación estándar.
Ejemplo :
Sequence : [2, 3, 5, 6, 7, 9] Mean = 5.33 Total Terms, n = 6 Squared Deviation = (2 - 5.33)2 + (3 - 5.33)2 + (5 - 5.33)2 (6 - 5.33)2 + (7 - 5.33)2 + (9 - 5.33)2 Variance = Squared Deviation / n
Código –
Python3
# Variance import numpy as np Sequence = [2, 3, 5, 6, 7, 9] var = np.var(Sequence) print("Variance : ", var)
Producción :
Variance : 5.5555555555555545
- Desviación Estándar: Es la raíz cuadrada de la Varianza. También se conoce como norma euclidiana .
Ejemplo :
Sequence : [2, 3, 5, 6, 7, 9] Mean = 5.33 Total Terms, n = 6 Squared Deviation = (2 - 5.33)2 + (3 - 5.33)2 + (5 - 5.33)2 (6 - 5.33)2 + (7 - 5.33)2 + (9 - 5.33)2 Variance = Squared Deviation / n Standard Deviation = (Variance)1/2
Código –
Python3
# Standard Deviation import numpy as np Sequence = [2, 3, 5, 6, 7, 9] std = np.std(Sequence) print("Standard Deviation : ", std)
Producción :
Standard Deviation : 2.357022603955158
- Desviación absoluta media: se puede estimar una estimación típica para estas desviaciones. Si promediamos los valores, las desviaciones negativas compensarían las positivas. Además, la suma de las desviaciones de la media siempre es cero. Por lo tanto, es un enfoque simple para tomar la desviación promedio en sí.
Ejemplo :
Sequence : [2, 4, 6, 8] Mean = 5 Deviation around mean = [-3, -1, 1, 3] Mean Absolute Deviation = (3 + 1 + 1 + 3)/ 4
Python3
# Mean Absolute Deviation import numpy as np def mad(data): return np.mean(np.absolute( data - np.mean(data))) Sequence = [2, 4, 6, 8] print ("Mean Absolute Deviation : ", mad(Sequence))
Producción :
Mean Absolute Deviation : 2.0
Publicación traducida automáticamente
Artículo escrito por Mohit Gupta_OMG 🙂 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA