La medida de tendencia central en R Language representa todo el conjunto de datos por un solo valor. Nos da la ubicación de los puntos centrales. Hay tres medidas principales de tendencia central :
- Significar
- Mediana
- Modo
requisito previo :
Antes de realizar cualquier cálculo, en primer lugar, debemos preparar nuestros datos, guardarlos en archivos .txt o .csv externos y es una buena práctica guardar el archivo en el directorio actual. Después de esa importación, sus datos en R de la siguiente manera:
Obtenga el archivo CSV aquí.
R
# R program to import data into R # Import the data using read.csv() myData = read.csv("CardioGoodFitness.csv", stringsAsFactors=F) # Print the first 6 rows print(head(myData))
Producción:
Product Age Gender Education MaritalStatus Usage Fitness Income Miles 1 TM195 18 Male 14 Single 3 4 29562 112 2 TM195 19 Male 15 Single 2 3 31836 75 3 TM195 19 Female 14 Partnered 4 3 30699 66 4 TM195 19 Male 12 Single 3 3 32973 85 5 TM195 20 Male 13 Partnered 4 2 35247 47 6 TM195 20 Female 14 Partnered 3 3 32973 66
Media en lenguaje de programación R
Es la suma de las observaciones dividida por el número total de observaciones. También se define como promedio, que es la suma dividida por la cuenta.
Donde, n = número de términos
Ejemplo:
R
# R program to illustrate # Descriptive Analysis # Import the data using read.csv() myData = read.csv("CardioGoodFitness.csv", stringsAsFactors=F) # Compute the mean value mean = mean(myData$Age) print(mean)
Producción:
[1] 28.78889
Mediana en lenguaje de programación R
Es el valor medio del conjunto de datos. Divide los datos en dos mitades. Si el número de elementos en el conjunto de datos es impar, entonces el elemento central es la mediana y si es par, la mediana sería el promedio de dos elementos centrales.
Donde n = número de términos
Sintaxis: mediana (x, na.rm = falso)
Donde, X es un vector y na.rm se usa para eliminar el valor faltante
Ejemplo:
R
# R program to illustrate # Descriptive Analysis # Import the data using read.csv() myData = read.csv("CardioGoodFitness.csv", stringsAsFactors=F) # Compute the median value median = median(myData$Age) print(median)
Producción:
[1] 26
Modo en lenguaje de programación R
Es el valor que tiene la frecuencia más alta en el conjunto de datos dado. El conjunto de datos puede no tener moda si la frecuencia de todos los puntos de datos es la misma. Además, podemos tener más de un modo si encontramos dos o más puntos de datos que tienen la misma frecuencia. No hay una función incorporada para encontrar el modo en R, por lo que podemos crear nuestra propia función para encontrar el modo o podemos usar el paquete llamado modest.
Creación de una función definida por el usuario para encontrar el modo
No hay una función incorporada para encontrar el modo en R. Entonces, creemos una función definida por el usuario que devolverá el modo de los datos pasados. Usaremos el método table() para esto, ya que crea una representación categórica de datos con los nombres de las variables y la frecuencia en forma de tabla. Ordenaremos la columna Edad en orden descendente y devolveremos el valor 1 de los valores ordenados.
Ejemplo: modo de búsqueda ordenando la columna del marco de datos
R
# Import the data using read.csv() myData = read.csv("CardioGoodFitness.csv", stringsAsFactors=F) mode = function(){ return(sort(-table(myData$Age))[1]) } mode()
Producción:
25: -25
Uso del paquete modesto
Podemos usar el paquete modesto de la R. Este paquete proporciona métodos para encontrar la moda de los datos univariados y la moda de la distribución de probabilidad habitual.
Ejemplo:
R
# R program to illustrate # Descriptive Analysis # Import the library library(modest) # Import the data using read.csv() myData = read.csv("CardioGoodFitness.csv", stringsAsFactors=F) # Compute the mode value mode = mfv(myData$Age) print(mode)
Producción:
[1] 25
Publicación traducida automáticamente
Artículo escrito por AmiyaRanjanRout y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA