Unión de datos en R con el paquete Dplyr

En este artículo, veremos los diferentes métodos para unir datos con dplyr en el lenguaje de programación R.

Necesitamos cargar el paquete dplyr. Escriba los siguientes comandos:

Install - install.packages("dplyr")          
Load - library("dplyr") 

Método 1: usar unión interna 

En este método de unir datos, el usuario llama a la función inner_join, lo que resultará en datos unidos con los registros que tienen valores coincidentes en ambas tablas en el lenguaje de programación R. 

Función inner_join():

Esta función incluye todas las filas en `x` e `y`. 

Sintaxis:

unión_interna(x, y, por = NULL, en = NULL)

Parámetros:

  • x: una tabla de datos
  • y: Una tabla de datos
  • by: Un vector de caracteres de variables para unirse.
  • on: indica qué columnas de x se deben unir con qué columnas de y.

Ejemplo:

En este ejemplo, usaremos la función inner_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.

R

# load the library
library("dplyr")
  
# create dataframe with 1 to 5 integers
gfg1 < -data.frame(ID=c(1: 5))
  
# create dataframe with 4 to 8 integers
gfg2 < -data.frame(ID=c(4: 8))
  
# perform inner join
inner_join(gfg1, gfg2, by="ID")

Producción:

 ID
1 4
2 5 

Método 2: usar la combinación izquierda

En este método de unir datos, el usuario llama a la función left_join y esto dará como resultado datos unidos que consisten en hacer coincidir todas las filas en el primer marco de datos con los valores correspondientes en el segundo en el lenguaje de programación R.

función izquierda_join():

Esta función incluye todas las filas en `x`. 

Sintaxis:

left_join(x, y, por = NULL, on = NULL)

Parámetros :

  • x: una tabla de datos
  • y: Una tabla de datos
  • by: Un vector de caracteres de variables para unirse.
  • on: indica qué columnas de x se deben unir con qué columnas de y.

Ejemplo:

En este ejemplo, usaremos la función left_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.

R

# load the library
library("dplyr") 
  
# create the dataframes
gfg1<-data.frame(ID=c(1:5))
  
gfg2<-data.frame(ID=c(4:8))
  
# perform left join
left_join(gfg1,gfg2, by = "ID")    

Producción:

  ID
1  1
2  2
3  3
4  4
5  5

Método 3: Usando la combinación derecha

En este método de unir datos, el usuario llama a la función right_join y esto dará como resultado datos unidos que consisten en hacer coincidir todas las filas en el segundo marco de datos con los valores correspondientes en el primero en el lenguaje de programación R.

función right_join():

Esta función incluye todas las filas en `y` y las filas correspondientes de ‘x’.

Sintaxis:

right_join(x, y, por = NULL, on = NULL)

Parámetros:

  • x: una tabla de datos
  • y: Una tabla de datos
  • by: Un vector de caracteres de variables para unirse.
  • on: indica qué columnas de x se deben unir con qué columnas de y.

Ejemplo:

En este ejemplo, usaremos la función right_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.

R

# load the library
library("dplyr") 
  
# create dataframes
gfg1<-data.frame(ID=c(1:5))
  
gfg2<-data.frame(ID=c(4:8))
  
# perform right join
right_join(gfg1,gfg2, by = "ID")    

Producción:

  ID
1  4
2  5
3  6
4  7
5  8

Método 4: Uso de la unión completa

En este método de unir datos, el usuario llama a la función right_join y esto dará como resultado datos unidos de todas las filas de las tablas unidas,

función full_join():

Esta función incluye todas las filas.

Sintaxis:

full_join(x, y, por = NULL, en = NULL)

Parámetros:

  • x: una tabla de datos
  • y: Una tabla de datos
  • by: Un vector de caracteres de variables para unirse.
  • on: indica qué columnas de x se deben unir con qué columnas de y.

Ejemplo:

En este ejemplo, usaremos la función full_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.

R

# load library
library("dplyr")  
  
# create dataframe
gfg1<-data.frame(ID=c(1:5))
gfg2<-data.frame(ID=c(4:8))
  
# perform full join
full_join(gfg1,gfg2, by = "ID")    

Producción:

  ID
1  1
2  2
3  3
4  4
5  5
6  6
7  7
8  8

Método 5: Usando Semijoin

En este método de unión de datos, el usuario llama a la función right_join y esta devolverá una copia de cada fila en la primera tabla para la que se encuentre al menos una coincidencia.

función semi_join():

Esta función devuelve todas las filas de x donde hay valores coincidentes en y, manteniendo solo las columnas de x.

Sintaxis:

semi_join(x, y, por = NULL, en = NULL)

Parámetros:

  • x: una tabla de datos
  • y: Una tabla de datos
  • by: Un vector de caracteres de variables para unirse.
  • on: indica qué columnas de x se deben unir con qué columnas de y.

Ejemplo:

En este ejemplo, usaremos la función semi_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.

R

# load the library
library("dplyr") 
  
# create the dataframes
gfg1<-data.frame(ID=c(1:5))
gfg2<-data.frame(ID=c(4:8))
  
# perform semijoin
semi_join(gfg1,gfg2, by = "ID")    

Producción:

  ID
1  4
2  5

Método 6: Usar anti unión

En este método de unión de datos, el usuario llama a la función right_join y esta devolverá todas las filas de x donde no haya valores coincidentes en y, conservando solo las columnas de x.

función anti_join():

Esta función devuelve todas las filas de x donde no hay valores coincidentes en y, manteniendo solo las columnas de x.

Sintaxis:

anti_join(x, y, por = NULL, en = NULL)

Parámetros:

  • x: una tabla de datos
  • y: Una tabla de datos
  • by: Un vector de caracteres de variables para unirse.
  • on: indica qué columnas de x se deben unir con qué columnas de y.

Ejemplo:

En este ejemplo, usaremos la función anti_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.

R

# load the library
library("dplyr") 
  
# create the dataframes
gfg1<-data.frame(ID=c(1:5))
gfg2<-data.frame(ID=c(4:8))
  
# perform anti join
anti_join(gfg1,gfg2, by = "ID")    

Producción:

  ID
1  1
2  2
3  3

Publicación traducida automáticamente

Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *