En este artículo, discutiremos cómo calcular la media de la columna del marco de datos en el lenguaje de programación R.
Se puede hacer de varias formas:
- Usando $-Operador
- Usando [[]]
- Uso del índice de columnas
- Uso de la función de resumen del paquete dplyr
- Uso de la función colMeans
Método 1: Usando $-Operador.
Este es uno de los métodos más simples, ya que en este enfoque para calcular los medios de la columna del marco de datos dado, solo necesita llamar a la función media, que es una función incorporada del lenguaje R y pasar el operador $con el nombre de la columna para cuya media se calculará como el parámetro de la función y, a cambio, esta función devolverá el valor medio de la columna proporcionada con el operador $.
Función media: Esta función calcula tomando la suma de los valores y dividiéndola por el número de valores en una serie de datos.
Sintaxis: mean(x, trim = 0, na.rm = FALSE, …)
Parámetros:
- x es el vector de entrada.
- trim se utiliza para descartar algunas observaciones de ambos extremos del vector ordenado.
- na.rm se usa para eliminar los valores faltantes del vector de entrada.
Ejemplo:
En este ejemplo, calcularemos la media de la tercera columna del marco de datos dado usando una función mean() con operación $en lenguaje R.
R
gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5), x2 = c(8, 4, 5, 1, 2), x3 = c(7, 9, 1, 2, 7)) mean(gfg_data$x3)
Producción:
5.2
Método 2: usando [[]].
En este método para calcular la media de la columna del marco de datos dado, el usuario debe llamar a la función mean(), y como su parámetro, el usuario usará [[]] y pasará el nombre de la columna del marco de datos cuya media se va a calcular, y esto devolverá la media de la columna proporcionada del marco de datos al usuario en lenguaje r.
En este ejemplo, calcularemos la media de la tercera columna del marco de datos dado (igual que en el ejemplo anterior) usando una función mean() con [[]] en lenguaje r.
R
gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5), x2 = c(8, 4, 5, 1, 2), x3 = c(7, 9, 1, 2, 7)) mean(gfg_data[["x3"]])
Producción:
5.2
Método 3: usar el índice de columnas.
En este enfoque de computación, la media del marco de datos dado, el usuario debe llamar a la función media y pasar el índice de columna de la columna cuya media se calculará como el parámetro de la función, y este proceso devolverá el valor medio a el usuario del índice de columna proporcionado como parámetro.
En este ejemplo, calcularemos la media de la tercera columna del marco de datos dado (igual que en el ejemplo anterior) usando una función mean() con índice de columna en lenguaje r.
R
gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5), x2 = c(8, 4, 5, 1, 2), x3 = c(7, 9, 1, 2, 7)) mean(gfg_data[ , 3])
Producción:
5.2
Método 4: Uso de la función de resumen del paquete dplyr.
En este método para calcular la media de la columna del marco de datos dado, el usuario primero debe instalar y cargar el paquete dplyr y llamar a la función de resumen de este paquete y pasar el parámetro requerido a esta función, este proceso conducirá a la devolución de la media de la columna proporcionada en el parámetro de la función.
función de resumen: esta función se usa normalmente en datos agrupados y funciona según los parámetros especificados
Sintaxis: resumir(.datos, …)
Parámetros:
- .datos:-A tbl. Todos los verbos principales son genéricos de S3 y proporcionan métodos para tbl_df(), dtplyr::tbl_dt() y dbplyr::tbl_dbi().
- …:-Pares nombre-valor de funciones resumen. El nombre será el nombre de la variable en el resultado.
En este ejemplo, calculamos la media de la tercera columna del marco de datos dado (igual que en el ejemplo anterior) utilizando la función de resumen del paquete dplyr en lenguaje r.
R
library("dplyr") gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5), x2 = c(8, 4, 5, 1, 2), x3 = c(7, 9, 1, 2, 7)) summarise(gfg_data, gfg_mean = mean(x3))
Producción:
gfg_mean 1 5.2
Método 5: Uso de la función colMeans.
En este método de computación, la media de la columna del marco de datos dado, el usuario solo necesita llamar a la función colMeans, que es una función integrada en lenguaje R y pasar el marco de datos como su parámetro, luego esto devolverá la media de toda la columna en el marco de datos proporcionado al usuario.
Función colMeans(): esta función ayuda a calcular las medias de filas (ponderadas) en las columnas de un objeto similar a una array numérica para cada nivel de una variable de agrupación.
Sintaxis: colmean(M, group = colnames(M), w = FALSE, record = FALSE,na_rm = FALSE, big = TRUE, …)
Parámetros:
- M:-una array, marco de datos o vector de datos numéricos. Se permiten valores faltantes.
- grupo:-un vector o factor que da la agrupación, con un elemento por fila de M.
- w:-un vector que da los pesos que se deben aplicar a cada uno de los bloques apilados de un objeto original
- record:-si es VERDADERO, entonces el resultado será en orden de clasificación (único (grupo)), si es FALSO (el valor predeterminado), será en el orden en que se encontraron los grupos.
- na_rm:-lógico (VERDADERO o FALSO). ¿Deberían descartarse los valores de NA (incluido NaN)?
- grande: su objeto es grande y es probable que se produzca un desbordamiento de enteros.
- …:-otros argumentos para ser pasados ao desde métodos.
En este ejemplo, estamos calculando la media de la tercera columna del marco de datos dado (igual que en el ejemplo anterior) usando la función colMeans() en el lenguaje R.
R
gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5), x2 = c(8, 4, 5, 1, 2), x3 = c(7, 9, 1, 2, 7)) colMeans(gfg_data)
Producción:
X1 3 X2 4 X3 5.2
Publicación traducida automáticamente
Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA