apply(), lapply(), sapply() y tapply() en R

En este artículo, aprenderemos sobre las funciones apply(), lapply(), sapply() y tapply() en el lenguaje de programación R.

La colección apply() es parte del paquete esencial de R. Esta familia de funciones nos ayuda a aplicar una determinada función a un determinado marco de datos, lista o vector y devolver el resultado como una lista o vector según la función que usemos. Existen los siguientes cuatro tipos de funciones en la familia de funciones apply():

aplicar() función

La función apply() nos permite aplicar una función a las filas o columnas de una array o marco de datos. Esta función toma la array o el marco de datos como argumento junto con la función y si debe aplicarse por fila o columna y devuelve el resultado en forma de vector, array o lista de valores obtenidos.

Sintaxis: apply(x, margen, función)

Parámetros:

  • x: determina la array de entrada, incluida la array.
  • margen: si el margen es 1, la función se aplica en la fila, si el margen es 2, se aplica en la columna.
  • función: determina la función que se va a aplicar en los datos de entrada.

Ejemplo:

Aquí hay un ejemplo básico que muestra el uso de la función apply() en filas y columnas.

R

# create sample data
sample_matrix <- matrix(C<-(1:10),nrow=3, ncol=10)
  
print( "sample matrix:")
sample_matrix
  
# Use apply() function across row to find sum
print("sum across rows:")
apply( sample_matrix, 1, sum)
  
# use apply() function across column to find mean
print("mean across columns:")
apply( sample_matrix, 2, mean)

Producción:

función lapply()

La función lapply() nos ayuda a aplicar funciones en objetos de lista y devuelve un objeto de lista de la misma longitud. La función lapply() en R Language toma una lista, un vector o un marco de datos como entrada y proporciona una salida en forma de objeto de lista. Dado que la función lapply() aplica una determinada operación a todos los elementos de la lista, no necesita un MARGEN. 

Sintaxis: lapply( x, divertido )

Parámetros:

  • x: determina el vector de entrada o un objeto.
  • fun: determina la función que se va a aplicar a los datos de entrada.

Ejemplo:

Aquí hay un ejemplo básico que muestra el uso de la función lapply() en un vector.

R

# create sample data
names <- c("priyank", "abhiraj","pawananjani",
           "sudhanshu","devraj")
print( "original data:")
names
  
# apply lapply() function
print("data after lapply():")
lapply(names, toupper)

Producción:

función sapply()

La función sapply() nos ayuda a aplicar funciones en una lista, un vector o un marco de datos y devuelve una array o un objeto array de la misma longitud. La función sapply() en el lenguaje R toma una lista, un vector o un marco de datos como entrada y proporciona una salida en forma de array u objeto de array. Dado que la función sapply() aplica una determinada operación a todos los elementos del objeto, no necesita un MARGEN. Es lo mismo que lapply() con la única diferencia del tipo de objeto devuelto.

Sintaxis: sapply( x, fun )

Parámetros:

  • x: determina el vector de entrada o un objeto.
  • fun: determina la función que se va a aplicar a los datos de entrada.

Ejemplo:

Aquí hay un ejemplo básico que muestra el uso de la función sapply() en un vector.

R

# create sample data
sample_data<- data.frame( x=c(1,2,3,4,5,6),
                          y=c(3,2,4,2,34,5))
print( "original data:")
sample_data
  
# apply sapply() function
print("data after sapply():")
sapply(sample_data, max)

Producción:

función tapply()

Tapply () nos ayuda a calcular medidas estadísticas (media, mediana, mín., máx., etc.) o una operación de función autoescrita para cada variable de factor en un vector. Nos ayuda a crear un subconjunto de un vector y luego aplicar algunas funciones a cada uno de los subconjuntos. Por ejemplo, en una organización, si tenemos datos del salario de los empleados y queremos encontrar el salario medio para hombres y mujeres, entonces podemos usar la función tapply() con hombres y mujeres como factor de género variable.

Sintaxis: tapply( x, index, fun )

Parámetros:

  • x: determina el vector de entrada o un objeto.
  • índice: determina el vector factor que nos ayuda a distinguir los datos.
  • fun: determina la función que se va a aplicar a los datos de entrada.

Ejemplo:

Aquí hay un ejemplo básico que muestra el uso de la función tapply() en el conjunto de datos de diamantes que proporciona la biblioteca de paquetes tidyverse.

R

# load library tidyverse
library(tidyverse)
  
# print head of diamonds dataset
print(" Head of data:")
head(diamonds)
  
# apply tapply function to get average price by cut
print("Average price for each cut of diamond:")
tapply(diamonds$price, diamonds$cut, mean)

Producción:

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *