Cuente el número de duplicados en R

En este artículo, veremos cómo averiguar la cantidad de duplicados en el lenguaje de programación R. 

Se puede hacer con dos métodos:

  • Usando la función duplicada().
  • Usando algoritmo.

Método 1: Usar duplicado()

Aquí usaremos la función duplicada() de las funciones R y dplyr.

Acercarse:

  • Inserte el paquete «library(tidyverse)» en el programa.
  • Cree un marco de datos o un vector.
  • Use la función duplicado() y verifique los datos duplicados.

Sintaxis: duplicado (x)

Parámetros: x: marco de datos o un vector

Ejemplo 1: Encontrar duplicado en vector.

Primero creemos un vector y encontremos la posición de los elementos duplicados en x.

R

x <- c(1, 1, 4, 5, 4, 6)
  
duplicated(x)

Extraiga los elementos duplicados en x.

R

x <- c(1, 1, 4, 5, 4, 6)
  
duplicated(x)
x[duplicated(x)]

Aquí podemos ver todos los elementos que están duplicados.

Ejemplo 2: Encontrar duplicados en Dataframe.

Ahora vamos a crear un marco de datos.

R

data <- data.frame(
  emp_id = c (1,1,2,4,5,6,6),  
  emp_name = c("Rick","Dan","Michelle",
               "Ryan","Gary","x" , "y"))
  
display(data)

Aquí tenemos un marco de datos y algunos elementos están duplicados, por lo que debemos encontrar los elementos duplicados en este marco de datos.

Comprobaremos qué columna tiene los datos duplicados.

R

duplicated(data$emp_id)

Así que ahora averigüe en la columna emp_id cuántos elementos duplicados hay.

R

data <- data.frame(
  emp_id = c (1, 1, 2, 4, 5, 6, 6),  
  emp_name = c("Rick", "Dan", "Michelle",
               "Ryan", "Gary", "x" , "y"))
  
duplicated[(data$emp_id), ]

Podemos ver todos los elementos duplicados en la columna emp_id.

Método 2: Usando el algoritmo.

Supongamos que tenemos un marco de datos con datos duplicados y tenemos que averiguar la cantidad de duplicados en ese marco de datos.

R

data <- data.frame(
  emp_id = c (1,1,2,4,5,6,6),  
  emp_name = c("Rick","Dan","Michelle","Ryan","Gary","x" , "y"))
  
sum(table(data$emp_id)-1)

Producción:

Podemos ver claramente que hemos calculado el número de duplicados en el marco de datos.

Publicación traducida automáticamente

Artículo escrito por akhilsharma870 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *