En este artículo, veremos cómo averiguar la cantidad de duplicados en el lenguaje de programación R.
Se puede hacer con dos métodos:
- Usando la función duplicada().
- Usando algoritmo.
Método 1: Usar duplicado()
Aquí usaremos la función duplicada() de las funciones R y dplyr.
Acercarse:
- Inserte el paquete «library(tidyverse)» en el programa.
- Cree un marco de datos o un vector.
- Use la función duplicado() y verifique los datos duplicados.
Sintaxis: duplicado (x)
Parámetros: x: marco de datos o un vector
Ejemplo 1: Encontrar duplicado en vector.
Primero creemos un vector y encontremos la posición de los elementos duplicados en x.
R
x <- c(1, 1, 4, 5, 4, 6) duplicated(x)
Extraiga los elementos duplicados en x.
R
x <- c(1, 1, 4, 5, 4, 6) duplicated(x) x[duplicated(x)]
Aquí podemos ver todos los elementos que están duplicados.
Ejemplo 2: Encontrar duplicados en Dataframe.
Ahora vamos a crear un marco de datos.
R
data <- data.frame( emp_id = c (1,1,2,4,5,6,6), emp_name = c("Rick","Dan","Michelle", "Ryan","Gary","x" , "y")) display(data)
Aquí tenemos un marco de datos y algunos elementos están duplicados, por lo que debemos encontrar los elementos duplicados en este marco de datos.
Comprobaremos qué columna tiene los datos duplicados.
R
duplicated(data$emp_id)
Así que ahora averigüe en la columna emp_id cuántos elementos duplicados hay.
R
data <- data.frame( emp_id = c (1, 1, 2, 4, 5, 6, 6), emp_name = c("Rick", "Dan", "Michelle", "Ryan", "Gary", "x" , "y")) duplicated[(data$emp_id), ]
Podemos ver todos los elementos duplicados en la columna emp_id.
Método 2: Usando el algoritmo.
Supongamos que tenemos un marco de datos con datos duplicados y tenemos que averiguar la cantidad de duplicados en ese marco de datos.
R
data <- data.frame( emp_id = c (1,1,2,4,5,6,6), emp_name = c("Rick","Dan","Michelle","Ryan","Gary","x" , "y")) sum(table(data$emp_id)-1)
Producción:
Podemos ver claramente que hemos calculado el número de duplicados en el marco de datos.
Publicación traducida automáticamente
Artículo escrito por akhilsharma870 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA