Tendencia central en programación R

La tendencia central es una de las características de las estadísticas descriptivas. La tendencia central indica cómo se agrupa el grupo de datos alrededor del valor central de la distribución. La tendencia central realiza las siguientes medidas:

  • Significado aritmetico
  • Significado geometrico
  • Significado armonico
  • Mediana
  • Modo

Significado aritmetico

La media aritmética se llama simplemente el promedio de los números que representa el valor central de la distribución de datos. Se calcula sumando todos los valores y luego dividiendo por el número total de observaciones.

Fórmula:
{\displaystyle X={\frac {1}{n}}\sum _{i=1}^{n}x_{i}={\frac {x_{1}+x_{2}+\cdots +x_ {n}}{n}}}

dónde,

X indica la media aritmética
x_iindica el yo^{\text{th}}valor en el vector de datos
n indica el número total de observaciones

En lenguaje R, la media aritmética se puede calcular por mean()función.

Sintaxis: mean(x, trim, na.rm = FALSE)

Parámetros:
x: representa el
recorte del objeto: especifica el número de valores que se eliminarán de cada lado del objeto antes de calcular la media. El valor está entre 0 y 0,5
na.rm: si es VERDADERO, elimina el valor NA de x

Ejemplo:

# Defining vector
x <- c(3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23)
  
# Print mean
print(mean(x))

Producción:

[1] 21.5

Significado geometrico

La media geométrica es un tipo de media que se calcula multiplicando todos los valores de los datos y, por lo tanto, muestra la tendencia central para una distribución de datos determinada.

Fórmula:
  \displaystyle X = \left(\prod _{i=1}^{n}x_{i}\right)^{\frac {1}{n}}={\sqrt[{n}]{x_{1 }x_{2}\cdots x_{n}}}

dónde,

X indica la media geométrica
x_iindica el yo^{\text{th}}valor en el vector de datos
n indica el número total de observaciones

prod()y length()la función ayuda a encontrar la media geométrica para un conjunto dado de números, ya que no existe una función directa para la media geométrica.

Sintaxis:

prod(x)^(1/length(x))

donde, la función
prod() devuelve el producto de todos los valores presentes en el vector x . la función
length() devuelve la longitud del vector x .

Ejemplo:

# Defining vector
x <- c(1, 5, 9, 19, 25)
  
# Print Geometric Mean
print(prod(x)^(1 / length(x)))

Producción:

[1] 7.344821

Significado armonico

La media armónica es otro tipo de media utilizada como otra medida de tendencia central. Se calcula como el recíproco de la media aritmética de los recíprocos del conjunto de valores dado.

Fórmula:
\displaystyle X=\frac {N}{\sum \limits _{i=1}^{N}{\frac {1}{x_{i}}}}

dónde,

X indica la media armónica
x_iindica el yo^{\text{th}}valor en el vector de datos
n indica el número total de observaciones

Ejemplo:
Modificar el código para encontrar la media armónica de un conjunto de valores dado.

# Defining vector
x <- c(1, 5, 8, 10)
  
# Print Harmonic Mean
print(1 / mean(1 / x))

Producción:

[1] 2.807018

Mediana

La mediana en estadística es otra medida de tendencia central que representa el valor medio de un conjunto dado de valores.

En lenguaje R, la mediana se puede calcular por median()función.

Sintaxis: mediana (x, na.rm = FALSO)

Parámetros:
x: es el vector de datos
na.rm: si es VERDADERO, elimina el valor NA de x

Ejemplo:

# Defining vector
x <- c(3, 7, 5, 13, 20, 23, 39, 
       23, 40, 23, 14, 12, 56, 23)
  
# Print Median
median(x)

Producción:

[1] 21.5

Modo

La moda de un conjunto dado de valores es el valor que más se repite en el conjunto. Pueden existir valores de modo múltiple en caso de que haya dos o más valores con una frecuencia máxima coincidente.

Ejemplo 1: valor de modo único
En lenguaje R, no hay función para calcular el modo. Entonces, modificando el código para encontrar el modo para un conjunto dado de valores.

# Defining vector
x <- c(3, 7, 5, 13, 20, 23, 39,  
       23, 40, 23, 14, 12, 56,
       23, 29, 56, 37, 45, 1, 25, 8)
  
# Generate frequency table
y <- table(x)
  
# Print frequency table
print(y)
  
# Mode of x
m <- names(y)[which(y == max(y))]
  
# Print mode
print(m)

Producción:

x
 1  3  5  7  8 12 13 14 20 23 25 29 37 39 40 45 56 
 1  1  1  1  1  1  1  1  1  4  1  1  1  1  1  1  2
[1] "23"

Ejemplo 2: valores de modo múltiple

# Defining vector
x <- c(3, 7, 5, 13, 20, 23, 39, 23, 40, 
       23, 14, 12, 56, 23, 29, 56, 37,
       45, 1, 25, 8, 56, 56)
  
# Generate frequency table
y <- table(x)
  
# Print frequency table
print(y)
  
# Mode of x
m <- names(y)[which(y == max(y))]
  
# Print mode
print(m)

Producción:

x
 1  3  5  7  8 12 13 14 20 23 25 29 37 39 40 45 56 
 1  1  1  1  1  1  1  1  1  4  1  1  1  1  1  1  4 
[1] "23" "56"

Publicación traducida automáticamente

Artículo escrito por utkarsh_kumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *