¿Cómo realizar una BUSCARV (similar a Excel) en R?

VLOOKUP es una función en Excel y es un acrónimo de búsqueda vertical. La tarea de esta función es buscar un valor particular en una columna para devolver un valor de una columna diferente pero en la misma fila.

Sintaxis:

BUSCARV([valor], [rango], [número de columna], [verdadero/falso])

Aquí,

  • value: Especifica el valor a buscar
  • rango: Especifica el rango en el que se tiene que buscar el valor
  • columna no: el número de la columna que contiene el valor de retorno
  • verdadero: si el usuario quiere una coincidencia aproximada
  • falso: si el usuario quiere la coincidencia exacta con el valor especificado

Método 1: Uso de Base R para realizar VLOOKUP:

Podemos lograr BUSCARV en base R usando la función merge().

Sintaxis:

fusionar (marco de datos1, marco de datos2, por = «nombre de columna»)

Aquí,

  • dataFrame1 y dataFrame2 son los marcos de datos y por argumento es opcional y se usa para especificar múltiples columnas para fusionar

Ejemplo:

En este programa, en primer lugar, hemos creado dos marcos de datos. Entonces hemos aplicado la función de fusión. Tenga en cuenta que hemos fusionado columnas sobre la base de la columna de sección, que es la misma en ambos marcos de datos.

R

# R program to perform VLOOKUP
# using merge function
  
# creating a dataframe
dataFrame1 < - data.frame(section=LETTERS[1:15],
                          team=rep(c('Alpha', 'Beta', 'Gamma'),
                                   each=5))
  
# creating another dataframe
dataFrame2 < - data.frame(section=LETTERS[1:15],
                          score=c(25, 13, 12, 16, 18, 19,
                                  26, 28, 20, 36, 44, 29,
                                  8, 6, 5))
  
# merge the two dataframes
merge(dataFrame1, dataFrame2, by="section")

Producción:

Método 2: usar dplyr para realizar VLOOKUP

Podemos usar la función de unión interna de la biblioteca dplyr en R para realizar de manera similar a la función BUSCARV.

Sintaxis:

unión_interna (marco de datos1, marco de datos2, por = «nombre de columna»)

Aquí,

  • dataFrame1 y dataFrame2 son los marcos de datos y por argumento es opcional y se usa para especificar múltiples columnas para fusionar

Sintaxis para instalar e importar el paquete dplyr:

install.package('dplyr')
library(dplyr)

Ejemplo:

En este programa, en primer lugar, hemos creado dos marcos de datos. Luego hemos aplicado la función inner_join. Tenga en cuenta que hemos fusionado columnas sobre la base de la columna de sección, que es la misma en ambos marcos de datos.

R

# R program to perform VLOOKUP 
# using dplyr
  
# Including library
library(dplyr)
  
# creating a dataframe
dataFrame1 <- data.frame(section=LETTERS[1:15],
                  team=rep(c('Alpha', 'Beta', 'Gamma'), 
                           each=5))
  
# creating another dataframe 
dataFrame2 <- data.frame(section=LETTERS[1:15],
                  score=c(25, 13, 12, 16, 18, 19,
                          26, 28, 20, 36, 44, 29,
                          8, 6, 5))
  
# merging the two dataframes by using 
# inner_join function
inner_join(dataFrame1, dataFrame2, by="section")

Producción:

Publicación traducida automáticamente

Artículo escrito por bhuwanesh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *