La desviación estándar y la varianza son las dos medidas de dispersión más utilizadas en conjuntos de valores. La desviación estándar (σ) de un conjunto de números es el grado en que estos números están dispersos. El valor de la desviación estándar se obtiene calculando la raíz cuadrada de la varianza. La varianza de un conjunto de números es el grado promedio en que cada uno de los valores del conjunto se desvía de la media. En otras palabras, es igual a la media de las diferencias al cuadrado de los valores de su media.
Desviación estándar y varianza de datos no agrupados
La varianza de los datos no agrupados se calcula de la siguiente manera:
- Calcule la media de los valores proporcionados.
- Calcula la diferencia entre cada valor y la media. Esta diferencia también se conoce como la desviación con respecto a la media.
- Eleve al cuadrado cada uno de los valores obtenidos en el paso 2 y sume todos los valores al cuadrado.
- Divide la suma calculada por la media.
La fórmula utilizada para calcular la varianza se muestra a continuación:
donde x̄ es la media y n es el número de valores en el conjunto.
Para calcular la desviación estándar (σ), primero calculamos la varianza usando los pasos anteriores y luego calculamos su raíz cuadrada:
Medidas de dispersión: rango, desviación y varianza
La dispersión estadística es el grado en que se dispersa un conjunto de valores. La varianza, la desviación estándar y el rango, que es la diferencia entre el valor más grande y el más pequeño en un conjunto de datos, son ejemplos de medidas de dispersión. Cuanto mayor sea el rango, la desviación estándar y la varianza, mayor será la dispersión de los valores.
Ejemplos de problemas de rango, varianza y desviación estándar
Los siguientes ejemplos ilustran estos tres conceptos. Suponemos dos conjuntos de números aleatorios: Conjunto1 = {1, 3, 7, 9, 11, 15}, Conjunto2 = {10, 20, 33, 67, 82}
Ejemplo 1: este ejemplo explica cómo calcular el rango de un conjunto de datos.
Solución:
- El rango es la diferencia entre el valor más alto y el valor más bajo para un conjunto dado de valores.
- En Set1, el valor más grande es 15 y el valor más pequeño es 1. Por lo tanto, el rango de Set1 es 15 – 1 = 14.
- En Set2, el valor más grande es 82 mientras que el valor más pequeño es 10. por lo tanto, el rango es 82 – 10 = 70.
Concluimos que Set2 tiene una mayor dispersión porque tiene un rango más alto.
Ejemplo 2: este ejemplo explica cómo calcular la varianza de un conjunto de datos
Solución:
- Para calcular la varianza de Set1, primero tenemos que calcular la media:
M1 = (1 + 3 + 7 + 9 + 11 + 15) / 6 = 23/3 = 7.7- La desviación de los valores 1, 3, 7, 9, 11, 15 de la media, respectivamente, son: 6,7, 4,7, 0,7, 1,3, 3,3, 7,3.
V1 = ((6,7)^2 + (4,7)^2 + (0,7)^2 + (1,3)^2 + (3,3)^2 + (7,3)^2) / 6 = 133,34 / 6 = 22,2- Para calcular la varianza de Set2, primero tenemos que calcular la media:
M2 = (10 + 20 + 33 + 67 + 82) / 5 = 42.4- La desviación de los valores 10, 20, 33, 67, 82 de la media, respectivamente, son: 32.4, 22.4, 9.4, 24.6, 39.6
V1 = ((32.4)^2 + (22.4)^2 + (9.4)^ 2 + (24,6)^2 + (39,6)^2) / 5 = 3813,2 / 5 = 762,64- Concluimos que Set2 tiene una dispersión más alta porque tiene una varianza más alta.
Ejemplo 3: Este ejemplo explica cómo calcular la desviación estándar.
Solución:
- A partir de los valores de V1 y V2 obtenidos en el ejemplo anterior, calculamos:
σ1 = √(22,2) = 4,7
σ2 = √(762,64) = 27,6- Concluimos que Set2 tiene una dispersión más alta porque tiene una desviación estándar más alta.
Rango y desviación media para datos agrupados
Los datos agrupados se clasifican en dos tipos: el primero es una distribución de frecuencia continua, donde los valores se agrupan en intervalos y cada intervalo está asociado con un valor de frecuencia. El segundo tipo es la distribución de frecuencia discreta, donde cada valor está asociado con un valor de frecuencia.
Rango
- Para calcular el rango de una distribución de frecuencia continua, calculamos la diferencia entre el límite inferior del intervalo mínimo y el límite superior del intervalo máximo. Suponiendo que el intervalo mínimo es (a -f) y el intervalo máximo es (v – z):
- Para una distribución de frecuencia discreta, simplemente calculamos la diferencia entre el valor más pequeño (S) y el valor más grande (L):
Significar
- Para calcular la media de una distribución de frecuencia continua, tomamos los valores en los centros de cada intervalo, luego multiplicamos cada uno de estos valores por el valor de frecuencia de su intervalo. Luego, sumamos los valores y multiplicamos la suma por el número total de valores (la suma de todos los valores de frecuencia). Se utiliza la siguiente fórmula:
- El cálculo de la media para una distribución de frecuencias discreta es el mismo que el de una distribución de frecuencias continua, pero con una diferencia. La distribución de frecuencia discreta tiene valores discretos en lugar de intervalos. Por lo tanto, en lugar de tomar el valor en el centro de un intervalo, tomamos cada valor discreto, lo multiplicamos por su valor de frecuencia, luego sumamos estos productos y los dividimos por el valor de frecuencia total. Se utiliza la misma fórmula. sin embargo, en este caso, xi es el valor discreto i y fi es la frecuencia del valor discreto i.
Desviación media
- Para calcular la desviación media de una distribución de frecuencia continua, calculamos las diferencias entre el punto medio de cada intervalo y la media. luego, multiplicamos cada diferencia por la frecuencia del intervalo y sumamos todos los valores producidos. finalmente, dividimos la suma por el número total de valores (frecuencia total). se utiliza la siguiente fórmula:
- El cálculo de la desviación media para una distribución de frecuencias discreta es el mismo que para una distribución de frecuencias continua, pero en lugar de tomar el valor en el centro de un intervalo, tomamos cada valor discreto, calculamos la diferencia entre el valor y la media, multiplique la diferencia por la frecuencia del valor discreto, luego sume estos productos y divídalos por el valor de frecuencia total. Se utiliza la misma fórmula. sin embargo, en este caso, xi es el valor discreto i y fi es la frecuencia del valor discreto i.
Cálculo de la media, la mediana y la moda
La media, la mediana y la moda pueden decirnos qué valor puede representar el conjunto de datos, cada uno de una manera diferente. Estas tres medidas de tendencia central se explican a continuación:
- Para calcular la media, dividimos la suma de los valores por el número de los valores dados.
- La mediana es básicamente el número en el centro del conjunto de datos cuando el conjunto está organizado en orden ascendente o descendente. En un conjunto de datos con un número de valores n:
si n es un número impar, calculamos (n-1/2). El valor del índice resultante es la mediana, considerando que el índice del primer valor es 1, el segundo es 2 y así sucesivamente.
si n es un número par, los valores de los índices (n/2) y (n/2 +1) se suman y la suma se divide por 2 para obtener el valor medio. Este valor es la mediana del conjunto. - La moda es el número más frecuente en un conjunto de valores
Problemas de muestra
Problema 1: Dado un conjunto de valores no agrupados {7, 8, 3, 6, 7, 8, 9, 7, 5, -2}. Calcula la media, la mediana y la moda de este conjunto.
Solución:
Media:
Primero sumamos los valores: sum = 7 + 8 + 3 + 6 + 7 + 8 + 9 + 7 + 5 + -2 = 58
Tenemos n = 10 valores en el conjunto. Por lo tanto, dividimos la suma por 10.
Media = 58/10 = 5,8Mediana:
primero ordenamos los valores en orden ascendente:
-2, 3, 5, 6, 7, 7, 7, 8, 8, 9
El número de valores aquí es n = 10. Por lo tanto, tomamos el valor en n/ 2 = 10/2 = 5, que es 7, y el valor en n/2 +1 = 10/2 + 1 = 6, que también es . el valor promedio es 7+7/2 = 7.
Mediana = 7Moda:
Podemos ver que el número 7 se repite 3 veces en el conjunto, el 8 se repite dos veces, y el resto de valores se repiten una vez. Por tanto, el valor más frecuente es 7.
Moda = 7
Ejemplo 2 : dado un conjunto de valores no agrupados {1, 4, 9, 9, 6, 30, 21, 6, 1}. Calcula la media, la mediana y la moda de este conjunto.
Solución:
Media:
Suma = 1 + 4 + 9 + 9 + 6 + 30 + 21 + 6 +1 = 87
Media = 87/9 = 9,7Mediana:
Los valores en orden ascendente: 1, 1, 4, 6, 6, 9, 9, 21, 30
El número de valores aquí es n = 9. Por lo tanto, tomamos el valor en (n/2) + 1 = 4 + 1 = 5, que es 6.
Mediana = 6Moda:
Los números 1, 6 y 9 se repiten cada uno dos veces en el conjunto, el 8 se repite dos veces, mientras que el resto de los valores solo se repiten una vez. Por lo tanto, tenemos múltiples valores de moda. El conjunto es trimodal, lo que significa que tiene tres modos.
Moda= 1, 6, 9
Ejemplo 3 : dado un conjunto de datos agrupados con distribución de frecuencia continua:
Intervalo (clase) | Frecuencia |
---|---|
2-4 | 3 |
4-6 | 4 |
6-8 | 2 |
Calcule el rango, la media y la desviación media.
Solución:
Rango:
El valor más bajo en el intervalo más bajo = 2, y el valor más alto en el intervalo más alto = 8
Rango = 8 – 2 = 6Media:
valores centrales para cada intervalo (respectivamente): 3, 5, 7
Suma de cada valor central multiplicada por su frecuencia = 3*3 + 5*4 + 7*2 = 43
Media = 43/(3 + 4 + 2) = 4,8Desviación media:
diferencia entre cada punto medio y la media (respectivamente): |3 – 4,8| = 1,8, 5 – 4,8 = 0,2, 7 – 4,8 = 2,2
Suma de diferencias multiplicada por las frecuencias: 1,8*3 + 0,2*4 + 2,2*2 = 10,6
Desviación media = 10,6 / 9 = 1,2
Ejemplo 4 : dado un conjunto de datos agrupados con distribución de frecuencia discreta:
Valor (clase) | Frecuencia |
---|---|
1 | 3 |
5 | 4 |
7 | 2 |
Calcule el rango, la media y la desviación media.
Solución:
Rango:
El valor más bajo = 1, y el valor más alto en el intervalo más alto = 7
Rango = 7 – 1= 6Media:
Suma de cada valor discreto multiplicado por su frecuencia = 1*3 + 5*4 + 7*2 = 37
Media = 37/(3 + 4 + 2) = 4,1Desviación Media:
Diferencia entre cada valor y la media (respectivamente): |1 – 4.1| = 3,1, 5 – 4,1 = 0,9, 7 – 4,1 = 2,9
Suma de diferencias multiplicada por las frecuencias: 3,1*3 + 0,9*4 + 4,1*2 = 21,1
Desviación media = 21,1 / 9 = 2,3
Publicación traducida automáticamente
Artículo escrito por arwaaalkindi y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA