En este artículo, discutiremos cómo encontrar la diferencia entre dos marcos de datos utilizando el paquete Dplyr en el lenguaje de programación R.
Establecer diferencia se refiere a obtener o extraer esos valores de un conjunto de datos que no están presentes en el otro. Para esto, dplyr admite una función llamada setdiff(). setdiff() se usa para devolver los datos presentes en el primer marco de datos pero no presentes en el segundo marco de datos.
Sintaxis :
setdiff(marco de datos1,marco de datos2)
Ejemplo 1: programa R para realizar la operación setdiff() del segundo marco de datos con el primer marco de datos
R
library(dplyr) # create dataframe1 with college # 1 data data1=data.frame(id=c(1,2,3,4,5), name=c('sravan','ojaswi','bobby', 'gnanesh','rohith')) # create dataframe1 with college # 2 data data2=data.frame(id=c(1,2,3,4,5,6,7), name=c('sravan','ojaswi','bobby', 'gnanesh','rohith', 'pinkey','dhanush')) # set difference of second dataframe # and first dataframe print(setdiff(data2,data1))
Producción:
Ejemplo 2: programa R para realizar la operación setdiff() del primer marco de datos con el segundo marco de datos
R
library(dplyr) # create dataframe1 with college # 1 data data1=data.frame(id=c(1,2,3,4,5), name=c('sravan','ojaswi','bobby', 'gnanesh','rohith')) # create dataframe1 with college # 2 data data2=data.frame(id=c(1,2,3,4,5,6,7), name=c('sravan','ojaswi','bobby', 'gnanesh','rohith', 'pinkey','dhanush')) # set difference of first dataframe # and second dataframe print(setdiff(data1,data2))
Producción:
Publicación traducida automáticamente
Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA