En este artículo, veremos los diferentes métodos para unir datos con dplyr en el lenguaje de programación R.
Necesitamos cargar el paquete dplyr. Escriba los siguientes comandos:
Install - install.packages("dplyr") Load - library("dplyr")
Método 1: usar unión interna
En este método de unir datos, el usuario llama a la función inner_join, lo que resultará en datos unidos con los registros que tienen valores coincidentes en ambas tablas en el lenguaje de programación R.
Función inner_join():
Esta función incluye todas las filas en `x` e `y`.
Sintaxis:
unión_interna(x, y, por = NULL, en = NULL)
Parámetros:
- x: una tabla de datos
- y: Una tabla de datos
- by: Un vector de caracteres de variables para unirse.
- on: indica qué columnas de x se deben unir con qué columnas de y.
Ejemplo:
En este ejemplo, usaremos la función inner_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.
R
# load the library library("dplyr") # create dataframe with 1 to 5 integers gfg1 < -data.frame(ID=c(1: 5)) # create dataframe with 4 to 8 integers gfg2 < -data.frame(ID=c(4: 8)) # perform inner join inner_join(gfg1, gfg2, by="ID")
Producción:
ID 1 4 2 5
Método 2: usar la combinación izquierda
En este método de unir datos, el usuario llama a la función left_join y esto dará como resultado datos unidos que consisten en hacer coincidir todas las filas en el primer marco de datos con los valores correspondientes en el segundo en el lenguaje de programación R.
función izquierda_join():
Esta función incluye todas las filas en `x`.
Sintaxis:
left_join(x, y, por = NULL, on = NULL)
Parámetros :
- x: una tabla de datos
- y: Una tabla de datos
- by: Un vector de caracteres de variables para unirse.
- on: indica qué columnas de x se deben unir con qué columnas de y.
Ejemplo:
En este ejemplo, usaremos la función left_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.
R
# load the library library("dplyr") # create the dataframes gfg1<-data.frame(ID=c(1:5)) gfg2<-data.frame(ID=c(4:8)) # perform left join left_join(gfg1,gfg2, by = "ID")
Producción:
ID 1 1 2 2 3 3 4 4 5 5
Método 3: Usando la combinación derecha
En este método de unir datos, el usuario llama a la función right_join y esto dará como resultado datos unidos que consisten en hacer coincidir todas las filas en el segundo marco de datos con los valores correspondientes en el primero en el lenguaje de programación R.
función right_join():
Esta función incluye todas las filas en `y` y las filas correspondientes de ‘x’.
Sintaxis:
right_join(x, y, por = NULL, on = NULL)
Parámetros:
- x: una tabla de datos
- y: Una tabla de datos
- by: Un vector de caracteres de variables para unirse.
- on: indica qué columnas de x se deben unir con qué columnas de y.
Ejemplo:
En este ejemplo, usaremos la función right_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.
R
# load the library library("dplyr") # create dataframes gfg1<-data.frame(ID=c(1:5)) gfg2<-data.frame(ID=c(4:8)) # perform right join right_join(gfg1,gfg2, by = "ID")
Producción:
ID 1 4 2 5 3 6 4 7 5 8
Método 4: Uso de la unión completa
En este método de unir datos, el usuario llama a la función right_join y esto dará como resultado datos unidos de todas las filas de las tablas unidas,
función full_join():
Esta función incluye todas las filas.
Sintaxis:
full_join(x, y, por = NULL, en = NULL)
Parámetros:
- x: una tabla de datos
- y: Una tabla de datos
- by: Un vector de caracteres de variables para unirse.
- on: indica qué columnas de x se deben unir con qué columnas de y.
Ejemplo:
En este ejemplo, usaremos la función full_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.
R
# load library library("dplyr") # create dataframe gfg1<-data.frame(ID=c(1:5)) gfg2<-data.frame(ID=c(4:8)) # perform full join full_join(gfg1,gfg2, by = "ID")
Producción:
ID 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8
Método 5: Usando Semijoin
En este método de unión de datos, el usuario llama a la función right_join y esta devolverá una copia de cada fila en la primera tabla para la que se encuentre al menos una coincidencia.
función semi_join():
Esta función devuelve todas las filas de x donde hay valores coincidentes en y, manteniendo solo las columnas de x.
Sintaxis:
semi_join(x, y, por = NULL, en = NULL)
Parámetros:
- x: una tabla de datos
- y: Una tabla de datos
- by: Un vector de caracteres de variables para unirse.
- on: indica qué columnas de x se deben unir con qué columnas de y.
Ejemplo:
En este ejemplo, usaremos la función semi_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.
R
# load the library library("dplyr") # create the dataframes gfg1<-data.frame(ID=c(1:5)) gfg2<-data.frame(ID=c(4:8)) # perform semijoin semi_join(gfg1,gfg2, by = "ID")
Producción:
ID 1 4 2 5
Método 6: Usar anti unión
En este método de unión de datos, el usuario llama a la función right_join y esta devolverá todas las filas de x donde no haya valores coincidentes en y, conservando solo las columnas de x.
función anti_join():
Esta función devuelve todas las filas de x donde no hay valores coincidentes en y, manteniendo solo las columnas de x.
Sintaxis:
anti_join(x, y, por = NULL, en = NULL)
Parámetros:
- x: una tabla de datos
- y: Una tabla de datos
- by: Un vector de caracteres de variables para unirse.
- on: indica qué columnas de x se deben unir con qué columnas de y.
Ejemplo:
En este ejemplo, usaremos la función anti_join() del paquete dplyr para unir dos datos diferentes como se muestra en la imagen de arriba en el lenguaje de programación R.
R
# load the library library("dplyr") # create the dataframes gfg1<-data.frame(ID=c(1:5)) gfg2<-data.frame(ID=c(4:8)) # perform anti join anti_join(gfg1,gfg2, by = "ID")
Producción:
ID 1 1 2 2 3 3
Publicación traducida automáticamente
Artículo escrito por geetansh044 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA