Medida de Dispersión

Esta era se llama la era de los datos, los datos se generan en casi todas partes y todos los sistemas en este momento están inundados de datos. Hay muchas técnicas disponibles que se presentan para resumir y analizar los datos. La media es una de las estadísticas importantes que se utilizan para resumir el centro de los datos. Esta medida no es suficiente para dar una idea sobre los datos completos, es posible que los datos estén dispersos y la media no es suficiente para expresar eso. Así, se utilizan algunas otras medidas que se denominan medidas de dispersión. Estas medidas nos permiten medir la dispersión en los datos. Veamos estas medidas en detalle. 

Medidas de dispersión

Las medidas de dispersión miden la dispersión de los datos, es decir, qué tan lejos están los valores en la distribución. Estas medidas capturan la variación entre diferentes valores de los datos. Intuitivamente, la dispersión es la medida de la medida en que los puntos de la distribución difieren del promedio de la distribución. Las medidas de dispersión se pueden clasificar en dos categorías que se muestran a continuación:  

  1. Medidas absolutas de dispersión
  2. Medidas relativas de dispersión

Medidas absolutas de dispersión 

Estas medidas de dispersión se miden y expresan en las propias unidades de datos. Por ejemplo – Metros, Dólares, Kg, etc. Algunas medidas absolutas de dispersión son: 

  1. Rango: Se define como la diferencia entre el mayor y el menor valor de la distribución.
  2. Desviación media: esta es la media aritmética de la diferencia entre los valores y su media.
  3. Desviación Estándar: Esta es la raíz cuadrada del promedio aritmético del cuadrado de las desviaciones medidas de la media.

Rango

El rango es la diferencia entre los valores mayor y menor de la distribución. Por lo tanto, se puede escribir como R = L – S, donde L representa el valor más grande de la distribución y S representa el valor más pequeño de la distribución. Cuanto mayor sea el valor del rango, mayor será la variación. Un inconveniente de esta medida es que solo tiene en cuenta el valor máximo y mínimo, que puede no ser siempre el indicador adecuado de cómo se dispersan los valores de la distribución. 

Por ejemplo, 

10, 20, 15, 0, 100 

El valor más pequeño S en los datos = 0, el valor más grande L en los datos = 100 

R = 100 – 0 = 100

Nota: El rango no se puede calcular para las distribuciones de frecuencias abiertas. Las distribuciones de frecuencia abiertas son aquellas distribuciones en las que el límite inferior de la clase más baja o el límite superior de la clase más alta no están definidos. 

Rango para datos no agrupados:

Pregunta 1: Averigüe el rango de las siguientes observaciones. 

20, 24, 31, 17, 45, 39, 51, 61

Solución:

El valor más grande en las observaciones dadas es 61 y el valor más pequeño es 17. El rango es 61 – 17 = 44

Rango para datos agrupados:

Pregunta 2: Averigüe el rango de la siguiente tabla de distribución de frecuencias para las calificaciones obtenidas por los estudiantes de la clase 10. 

Intervalos de marcas Numero de estudiantes
0-10 5
10-20 8
20-30 15
30-40 9

Solución:

Para el valor más grande: tome el límite superior de la clase más alta = 40 

Para el valor más pequeño: tome el límite inferior de la clase más baja = 0

Rango = 40 – 0 

Rango = 40 

Desviación media

El rango como medida de dispersión solo depende de los valores más altos y más bajos de los datos. La desviación media, por otro lado, mide la desviación de las observaciones de la media de la distribución. Dado que el promedio es el valor central de los datos, algunas desviaciones pueden ser positivas y otras pueden ser negativas. Si se suman así, su suma no revelará mucho, ya que tienden a cancelarse mutuamente. Por ejemplo, 

Considere los datos que se dan a continuación, 

-5, 10, 25

La media de estos datos = 10

Ahora la desviación de la media para diferentes valores es (-5 -10), (10 – 10), (25 – 10) es decir -15, 0, 15 

Ahora, al sumar las desviaciones, se muestra que hay una desviación cero de la media, lo cual es incorrecto. Por lo tanto, para contrarrestar este problema, solo se toman los valores absolutos de la diferencia al calcular la desviación media.

Entonces, desviación media (DM) = \frac{|(x_1 - \mu)| + |(x_2 - \mu)| + ....|(x_n - \mu)|}{n}

Desviación media de la media para datos no agrupados:

Para el cálculo de la desviación media para datos no agrupados, se deben seguir los siguientes pasos: 

  1. Calcule la media aritmética de todos los valores del conjunto de datos.
  2. Calcule la diferencia entre cada valor del conjunto de datos y la media. Sólo se considerarán los valores absolutos de las diferencias. |d|
  3. Calcular la media aritmética de estas desviaciones.

MD = \frac{\sum|d|}{n}

Pregunta 1: Calcule la desviación media para los datos desagrupados dados: 

2, 4, 6, 8, 10

Solución: 

Siguiendo los pasos mencionados anteriormente, 

Media = \mu = \frac{2 + 4 + 6 + 8 + 10}{5}

⇒ \mu = 6

MD = \frac{\sum|d|}{n}

⇒ MD = \frac{|(2 - 6)| + |(4 - 6)| + |(6 - 6)| + |(8 - 6)| + |(10 - 6)|}{5}

⇒ MD = \frac{4 + 2 + 0 + 2 + 4}{5}

⇒MD = \frac{12}{5}

⇒ DM = 2,4

Desviación media de la mediana para datos no agrupados:

Para el cálculo de la desviación media para datos no agrupados, se deben seguir los siguientes pasos: 

  1. Calcule la mediana de todos los valores del conjunto de datos.
  2. Calcula la diferencia entre cada valor del conjunto de datos y la mediana. Sólo se considerarán los valores absolutos de las diferencias. |d|
  3. Calcular la media aritmética de estas desviaciones.

Pregunta 2: Calcule la desviación media de la mediana para los datos desagrupados dados: 

2, 4, 6, 8, 10

Solución: 

Siguiendo los pasos mencionados anteriormente, 

La mediana de esto también es 6. 

MD = \frac{\sum|d|}{n}

⇒ MD = \frac{|(2 - 6)| + |(4 - 6)| + |(6 - 6)| + |(8 - 6)| + |(10 - 6)|}{5}

⇒ MD = \frac{4 + 2 + 0 + 2 + 4}{5}

⇒MD = \frac{12}{5}

⇒ DM = 2,4

Desviación media de la media para distribución de frecuencia continua:

Para el cálculo de la desviación media para datos no agrupados, se deben seguir los siguientes pasos: 

  1. Calcule la media aritmética de todos los valores del conjunto de datos.
  2. Calcular la diferencia entre el valor medio del intervalo de clase y la media. Sólo se considerarán los valores absolutos de las diferencias. |d|
  3. Multiplicar |d| con sus correspondientes frecuencias de grupo.
  4. Calcular la media aritmética de estas desviaciones.

MD = \frac{\sum f|d|}{n}

Pregunta 3: Calcula la desviación media para los datos dados: 

Intervalo de clases  Frecuencia
0-10 4
10-20 2
20-30 4
30-40 0

Solución: 

Siguiendo los pasos mencionados anteriormente, 

Media = \mu = \frac{4(5) + 2(15) + 4(25) + 0(35) }{5} = \frac{20 + 30 + 100 + 0}{} = \frac{150}{10} = 15

⇒ \mu = 15

MD = \frac{\sum|d|}{n}

⇒ MD = \frac{4|(5 - 15)| + 2|(15 - 15)| + 4|(25 - 15)| + 0|(35 - 15)| }{10}

⇒ MD = \frac{40 + 0 + 40 }{10}

⇒MD = \frac{80}{10}

⇒ MD = 8

Desviación media de la mediana para distribución de frecuencia continua:

Para el cálculo de la desviación media para datos no agrupados, se deben seguir los siguientes pasos: 

  1. Calcule la mediana para todos los valores del conjunto de datos.
  2. Calcule la diferencia entre el valor medio del intervalo de clase y la mediana. Sólo se considerarán los valores absolutos de las diferencias. |d|
  3. Multiplicar |d| con sus correspondientes frecuencias de grupo.
  4. Calcular la media aritmética de estas desviaciones.

MD = \frac{\sum f|d|}{n}

Pregunta 4: Calcula la desviación media para los datos dados: 

Intervalo de clases  Frecuencia
0-10 7
10-20 1
20-30 3
30-40 0

Solución: 

Siguiendo los pasos mencionados anteriormente, 

La mediana se encuentra en el intervalo (0-10), así que digamos que 5 es la mediana. 

MD = \frac{\sum|d|}{n}

⇒ MD = \frac{7|(5 - 5)| + 1|(15 - 5)| + 3|(25 - 15)| + 0|(35 - 15)| }{10}

⇒ MD = \frac{10 + 0 + 30 }{10}

⇒MD = \frac{40}{10}

⇒ MD = 4

Medidas relativas de dispersión

Estas medidas de desviación se expresan en forma de razones, porcentajes. Por ejemplo, la desviación estándar dividida por la media es un ejemplo de una medida relativa. Estas medidas son siempre adimensionales y también se conocen como coeficiente de dispersión. Estas medidas son útiles al comparar la variación de dos conjuntos de datos que tienen diferentes unidades. Por ejemplo, considere dos conjuntos de datos de pesos de estudiantes. En un conjunto de datos, el peso se mide en kilogramos y en otro, se mide en gramos. Ambos tendrán una variación equivalente en los valores, pero dado que las unidades son diferentes, las medidas absolutas de dispersión darán un valor muy alto para la dispersión en el conjunto de datos con pesos en gramos. Dado que las medidas absolutas de dispersión no son apropiadas en estos casos, se utilizan las medidas relativas de dispersión. 

Curva de Lorenz

La curva de Lorenz es una parte importante de la economía. Es una representación de la distribución de la riqueza y la renta. Fue desarrollado por Max.O. Lorenz para representar la desigualdad en la distribución de la riqueza. La siguiente figura muestra una curva de Lorenz típica. El área encerrada entre la línea recta y la línea curva se llama coeficiente de Gini. Cuanto más alejada está la línea curva de la línea recta, más desigualdad en la riqueza se indica. 

Esta curva se utiliza en muchos campos, como la ecología, los estudios de biodiversidad y el modelado empresarial. 

Coeficiente de Gini: Se define como la representación escalar de la medida de la desigualdad. 

Problemas de muestra

Pregunta 1: Averigüe el rango de las siguientes observaciones. 

20, 42, 13, 71, 54, 93, 15, 16

Solución:

El valor más grande en las observaciones dadas es 71 y el valor más pequeño es 13. El rango es 71 – 13 = 58

Pregunta 2: Averigüe el rango de la siguiente tabla de distribución de frecuencias para las calificaciones obtenidas por los estudiantes de la clase 10. 

Intervalos de marcas Numero de estudiantes
10-20 8
20-30 25
30-40 9

Solución:

Para el valor más grande: tome el límite superior de la clase más alta = 40 

Para el valor más pequeño: tome el límite inferior de la clase más baja = 10

Rango = 40 – 10

Rango = 30

Pregunta 3: Calcule la desviación media para los datos desagrupados dados: 

-5, -4, 0, 4, 5

Solución: 

Siguiendo los pasos mencionados anteriormente, 

Media = \mu = \frac{-5 + -4 + 0 + 4 + 5}{5}

⇒ \mu = 0

MD = \frac{\sum|d|}{n}

⇒ MD = \frac{|(-5 - 0)| + |(-4 - 0)| + |(0 - 0)| + |(4 - 0)| + |(5 - 0)|}{5}

⇒ MD = \frac{5 + 4 + 0 + 4 + 5}{5}

⇒MD = \frac{18}{5}

⇒ DM = 3,6

Pregunta 4: Calcula la desviación media para los datos dados: 

Intervalo de clases  Frecuencia
0-10 1
10-20 1
20-30 8
30-40 0

Solución: 

Siguiendo los pasos mencionados anteriormente, 

La mediana se encuentra en el intervalo (20-30), así que digamos que 25 es la mediana. 

MD = \frac{\sum|d|}{n}

⇒ MD = \frac{1|(5 - 25)| + 1|(15 - 25)| + 8|(25 - 25)| }{10}

⇒ MD = \frac{20 + 10 + 0 }{10}

⇒MD = \frac{30}{10}

⇒ MD = 3

Publicación traducida automáticamente

Artículo escrito por anjalishukla1859 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *