Medidas de tendencia central

La estadística es una rama importante de las matemáticas que se usa ampliamente en una variedad de disciplinas tradicionales como la economía, el comercio, la investigación, las encuestas, etc. En esta era digital actual, las tecnologías emergentes como la ciencia de datos y el aprendizaje automático se han disparado. Estas tecnologías también se centran en las estadísticas. Después de todo, las estadísticas tienen que ver con la recopilación, interpretación y presentación de datos. Básicamente, las estadísticas proporcionan información sobre los datos. 

Medidas de tendencia central

Un concepto estadístico esencial es la “ medida de tendencia central ”. Esta medida es una forma importante de resumir el conjunto de datos con un valor representativo. Esta medida proporciona una imagen aproximada de dónde se centran los puntos de datos. Las medidas de tendencia central más utilizadas son:

  • Significar
  • Mediana
  • Modo

Significar

El valor «promedio» se denomina como la media del conjunto de datos. Es muy fácil calcular la media. 

Pasos para calcular la media:

  • Paso 1 Contar el número de valores de datos. Que sea n.n
  • Paso 2 Sume todos los valores de los datos. Sea la suma s.
  • Paso 3 Media = Suma de todos los valores de datos (s)/Número total de valores de datos (n)

Mediana

El valor medio del conjunto de datos ordenados se denomina mediana. Considere un conjunto de datos que comprende ‘n’ elementos.

Pasos para calcular la mediana:

  • Paso 1 El conjunto de datos se organiza en orden creciente o decreciente.
  • Paso 2 Si el conjunto de datos tiene un número impar de valores de datos (n=impar), el valor central del conjunto de datos ordenado se calcula como la mediana. En otras palabras, los datos en el lugar (n + 1)/2 son la mediana del conjunto de datos.
  • Paso 3 Si el conjunto de datos tiene un número par de valores de datos (n = par), el promedio de dos valores medios se calcula como la mediana. es decir, la media de (n/2) y {(n/2) + 1} es la mediana del conjunto de datos.

Modo

El valor que ocurre con más frecuencia en el conjunto de datos se llama modo. 

Pasos para calcular el modo:

  • Paso 1 Use marcas de conteo para identificar cuántas veces ocurre cada valor de datos en el conjunto de datos.
  • Paso 2 El valor de datos con conteo máximo es la moda del conjunto de datos.

Ejemplos

Ejemplo 1. Considere el peso (en kg) de 5 niños como 36, 40, 32, 42, 30. Calculemos la media, la mediana y la moda:

Solución:

  • Media = (36 + 40 + 32 + 42 + 30)/5 = 180/5 = 36 kg
  • Mediana : organiza los datos en orden ascendente: 30, 32, 36, 40, 42 El valor medio es 36. Entonces, mediana = 36 kg.
  • Moda : 36 kg ocurre la mayor cantidad de veces, entonces moda = 36 kg

En este ejemplo, vimos que la media, la mediana y la moda son iguales.

Ejemplo 2. Considere las edades de cinco empleados como 30, 30, 32, 38, 60 años. Calcular las medidas de tendencia central.

Solución:

  • Media = (30 + 30 + 32 + 38 + 60)/5 = 190/5 = 38 años
  • Mediana: organice los datos en orden ascendente: 30, 30, 32, 38, 60. El valor más medio es 32. Entonces, mediana = 32 años
  • Moda : 30 años ocurre la mayor cantidad de empates, entonces moda = 30 años

En este ejemplo, vimos que la media, la mediana y la moda tienen valores diferentes. 

Ejemplo 3. Cinco estudiantes A, B, C, D, E aparecieron en una prueba y obtuvieron 80, 95, 90, 85 y 100 puntos respectivamente. encontrar la media?

Solución: 

Número total de estudiantes = 5

Suma de puntos = 80 + 95 + 90 + 85 +100 = 450 

Media = Suma de notas/número total de alumnos

          = 450/5 = 90 puntos

Ejemplo 4. Un bateador anota un promedio de 48 carreras en seis partidos. Si su puntaje en cinco partidos es 51, 45, 46, 44 y 49. ¿Encuentra su puntaje en el sexto partido?

Solución:

Número total de partidos = 6

Asumir su puntuación en el sexto partido = x carreras

Promedio = 48 carreras

Entonces, (51 + 45 + 46 + 44 + 49 + x)/6 = 48

Entonces, 235 + x = 48 x 6 = 288 = 235 + x = 288

x = 288 – 235 = 53

Anota 53 carreras en el sexto partido.

Ejemplo 5. El promedio de cinco números impares consecutivos es 15. ¿Encontrar los números?

Solución: 

Suponga que el número impar más pequeño sea x.

Entonces, los otros números son x + 2, x + 4, x + 6, x + 8

Dado que la media = 15.

Entonces, (x + x + 2 + x + 4 + x + 6 + x + 8)/5 = 15

= 5x + 20 = 75

= 5x = 55

x = 55/5 = 11

Entonces, los números son 11, 13, 15, 17, 19

Ejemplo 6. Un maestro reportó una media de 35 puntos en una clase de 20 estudiantes. Más tarde se dio cuenta de que las notas de un alumno eran en realidad 45, pero por error había escrito 25. Halla las notas medias correctas de la clase.

Solución: 

Media = 35

Número de estudiantes = 20

 Entonces, suma total de puntos = 32 × 20 = 700

Suma corregida de puntos = 700 – 25 + 45 = 720

Entonces, promedio = 720/20 = 36

Media correcta = 36 puntos

Distribuciones y Media

La media se ve muy afectada por los valores extremos del conjunto de datos. Si el conjunto de datos es simétrico, el valor medio se ubica exactamente en el centro. Sin embargo, en las distribuciones sesgadas, el valor medio se aleja del centro.

Caso 1: Distribución simétrica

Considere una distribución simétrica. Suponga que el salario mensual de los empleados de una organización es de 30k, 40k, 35k, 32k, 38k rupias.

Media = (30 + 40 + 35 + 32 + 38)/5 = 175/5 = 35k rupias

Mediana: ordena los datos en orden ascendente. 30k, 32k, 35k, 38k, 40k. Dado que el valor más medio en el conjunto de datos ordenados es 35k. Podemos concluir que el salario medio = 35k rupias. No hay modo claro ya que todo el valor de los datos ocurre el mismo número de veces.

Media = Mediana = moda en distribución simétrica

Caso 2: distribución sesgada

En una distribución asimétrica donde un valor es excepcionalmente diferente de otros valores, el valor medio cambia drásticamente. 

Media > mediana en distribución sesgada a la derecha

Media < mediana en distribución asimétrica a la izquierda

Supongamos un escenario en el que se promueve a un empleado y obtiene un aumento impresionante en el salario. Suponga que su salario cambia de 38k por mes a 85k por mes. Este es un caso de sesgo a la derecha ya que el valor de los datos se ha desplazado hacia la derecha. Según la figura, esperamos que la media sea mayor que la mediana.

Calculemos los nuevos valores de la media y la mediana 

El nuevo conjunto de datos tiene valores 30, 40, 35, 32, 88

Media = (30 + 40 + 35 + 32 + 88) = 225/5 = 45k rupias

Mediana:

Ordena los datos en orden ascendente.

30k, 32k, 35k, 40k, 88k

Dado que el valor más medio en el conjunto de datos ordenados es 35k, podemos concluir que el salario medio = 35k rupias. Por lo tanto, vimos que el valor medio cambió, pero el valor medio sigue siendo de 35k rupias. Es evidente que el valor medio es extremadamente sensible a los cambios en los datos. Sin embargo, la mediana es relativamente estable.

La mejor medida de tendencia central

  • La media es la medida preferida de tendencia central cuando los datos se distribuyen normalmente.
  • La mediana es la mejor medida de tendencia central cuando los datos están sesgados.
  • Al tratarse de variables nominales, el modelo es la mejor medida de tendencia central.

Conclusión

  • La media, la mediana y la moda son las medidas de tendencia central más importantes. El conjunto de datos completo puede estar representado por estos valores.
  • No es necesario que la media, la mediana y la moda tengan los mismos valores.
  • La media es sensible a los valores extremos de los datos.
  • No es prudente tomar la media de la distribución sesgada como el verdadero representante del conjunto de datos.
  • La mediana es una mejor manera de entender la distribución sesgada.
  • La media y la mediana no pueden ser cero a menos que todos los valores de los datos sean cero. Sin embargo, es posible que no haya moda en el conjunto de datos.

Publicación traducida automáticamente

Artículo escrito por ektamaini y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *