Media, mediana y moda en programación R

La medida de tendencia central en R Language representa todo el conjunto de datos por un solo valor. Nos da la ubicación de los puntos centrales. Hay tres medidas principales de tendencia central

  • Significar
  • Mediana
  • Modo

requisito previo

Antes de realizar cualquier cálculo, en primer lugar, debemos preparar nuestros datos, guardarlos en archivos .txt o .csv externos y es una buena práctica guardar el archivo en el directorio actual. Después de esa importación, sus datos en R de la siguiente manera: 

Obtenga el archivo CSV aquí.  

R

# R program to import data into R
 
# Import the data using read.csv()
myData = read.csv("CardioGoodFitness.csv",
                  stringsAsFactors=F)
# Print the first 6 rows
print(head(myData))

Producción: 

   Product Age Gender Education MaritalStatus Usage Fitness Income Miles
1   TM195  18   Male        14        Single     3       4  29562   112
2   TM195  19   Male        15        Single     2       3  31836    75
3   TM195  19 Female        14     Partnered     4       3  30699    66
4   TM195  19   Male        12        Single     3       3  32973    85
5   TM195  20   Male        13     Partnered     4       2  35247    47
6   TM195  20 Female        14     Partnered     3       3  32973    66

Media en lenguaje de programación R

Es la suma de las observaciones dividida por el número total de observaciones. También se define como promedio, que es la suma dividida por la cuenta.

Donde, n = número de términos

Ejemplo: 

R

# R program to illustrate
# Descriptive Analysis
 
# Import the data using read.csv()
myData = read.csv("CardioGoodFitness.csv",
                  stringsAsFactors=F)
 
# Compute the mean value
mean = mean(myData$Age)
print(mean)

Producción: 

[1] 28.78889

Mediana en lenguaje de programación R

Es el valor medio del conjunto de datos. Divide los datos en dos mitades. Si el número de elementos en el conjunto de datos es impar, entonces el elemento central es la mediana y si es par, la mediana sería el promedio de dos elementos centrales.

Donde n = número de términos

Sintaxis: mediana (x, na.rm = falso)

Donde, X es un vector y na.rm se usa para eliminar el valor faltante

Ejemplo: 

R

# R program to illustrate
# Descriptive Analysis
 
# Import the data using read.csv()
myData = read.csv("CardioGoodFitness.csv",
                  stringsAsFactors=F)
 
# Compute the median value
median = median(myData$Age)
print(median)

Producción: 

[1] 26

Modo en lenguaje de programación R

Es el valor que tiene la frecuencia más alta en el conjunto de datos dado. El conjunto de datos puede no tener moda si la frecuencia de todos los puntos de datos es la misma. Además, podemos tener más de un modo si encontramos dos o más puntos de datos que tienen la misma frecuencia. No hay una función incorporada para encontrar el modo en R, por lo que podemos crear nuestra propia función para encontrar el modo o podemos usar el paquete llamado modest.

Creación de una función definida por el usuario para encontrar el modo

No hay una función incorporada para encontrar el modo en R. Entonces, creemos una función definida por el usuario que devolverá el modo de los datos pasados. Usaremos el método table() para esto, ya que crea una representación categórica de datos con los nombres de las variables y la frecuencia en forma de tabla. Ordenaremos la columna Edad en orden descendente y devolveremos el valor 1 de los valores ordenados.

Ejemplo: modo de búsqueda ordenando la columna del marco de datos

R

# Import the data using read.csv()
myData = read.csv("CardioGoodFitness.csv",
                  stringsAsFactors=F)
 
mode = function(){
    return(sort(-table(myData$Age))[1])
}
 
mode()

Producción:

25: -25

Uso del paquete modesto

Podemos usar el paquete modesto de la R. Este paquete proporciona métodos para encontrar la moda de los datos univariados y la moda de la distribución de probabilidad habitual.

Ejemplo: 

R

# R program to illustrate
# Descriptive Analysis
 
# Import the library
library(modest)
 
# Import the data using read.csv()
myData = read.csv("CardioGoodFitness.csv",
                  stringsAsFactors=F)
 
# Compute the mode value
mode = mfv(myData$Age)
print(mode)

Producción: 

[1] 25

Publicación traducida automáticamente

Artículo escrito por AmiyaRanjanRout y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *