En este artículo, discutiremos cómo usar na.rm en el lenguaje de programación R. na.rm en R se usa para eliminar los valores de NA.
na.rm en vector
Cuando realizamos cualquier operación, tenemos que excluir los valores NA, de lo contrario, el resultado sería NA.
Sintaxis: función (vector, na.rm)
dónde
- vector es vector de entrada
- na.rm es para eliminar los valores de NA
- la función es realizar operaciones en vectores como sum, mean, min, max, etc.
Ejemplo 1: En este ejemplo, estamos calculando la media, la suma, el mínimo, el máximo y la desviación estándar con NA
R
# create a vector data = c(1,2,3,NA,45,34,NA,NA,23) # display print(data) # calculate mean including NA values print(mean(data,na.rm=FALSE)) # calculate sum including NA values print(sum (data,na.rm=FALSE)) # get minimum including NA values print(min(data,na.rm=FALSE)) # get maximum including NA values print(max(data,na.rm=FALSE)) # calculate standard deviation including # NA values print(sd (data,na.rm=FALSE))
Producción:
[1] 1 2 3 NA 45 34 NA NA 23 [1] NA [1] NA [1] NA [1] NA [1] NA
Ejemplo 2: En este ejemplo, estamos calculando la media, la suma, el mínimo, el máximo y la desviación estándar sin NA
R
# create a vector data = c(1,2,3,NA,45,34,NA,NA,23) # display print(data) # calculate mean excluding NA values print(mean(data,na.rm=TRUE)) # calculate sum excluding NA values print(sum (data,na.rm=TRUE)) # get minimum excluding NA values print(min(data,na.rm=TRUE)) # get maximum excluding NA values print(max(data,na.rm=TRUE)) # calculate standard deviation excluding # NA values print(sd (data,na.rm=TRUE))
Producción:
[1] 1 2 3 NA 45 34 NA NA 23 [1] 18 [1] 108 [1] 1 [1] 45 [1] 18.86796
na.rm en marco de datos
Tenemos que usar la función de aplicación para aplicar la función en el marco de datos con la función na.rm
Sintaxis : apply (marco de datos, 2, función, na.rm)
dónde
- dataframe es el dataframe de entrada
- La función es realizar algunas operaciones como media, min, max, etc.
- 2 representa la columna
- na.rm es para eliminar los valores de NA
Ejemplo 1 : en este ejemplo, estamos calculando la media, la suma, el mínimo, el máximo y la desviación estándar sin NA en todas las columnas
R
# create a dataframe with 3 columns data = data.frame(column1 = c(1,2,NA,34), column2 = c(NA,34,56,NA), column3 = c(NA,NA,32,56)) # display print(data) # calculate mean including NA values apply(data, 2, mean , na.rm = FALSE) # calculate sum including NA values apply(data, 2, sum , na.rm = FALSE) # calculate min including NA values apply(data, 2, min, na.rm = FALSE) # calculate max including NA values apply(data, 2, max , na.rm = FALSE) # calculate standard deviation including # NA values apply(data, 2, sd, na.rm = FALSE)
Producción:
Ejemplo 2: Excluyendo valores NA
R
# create a dataframe with 3 columns data = data.frame(column1 = c(1,2,NA,34), column2 = c(NA,34,56,NA), column3 = c(NA,NA,32,56)) # display print(data) # calculate mean excluding NA values apply(data, 2, mean , na.rm = TRUE) # calculate sum excluding NA values apply(data, 2, sum , na.rm = TRUE) # calculate min excluding NA values apply(data, 2, min, na.rm = TRUE) # calculate max excluding NA values apply(data, 2, max , na.rm = TRUE) # calculate standard deviation excluding # NA values apply(data, 2, sd, na.rm = TRUE)
Producción:
Publicación traducida automáticamente
Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA