¿Cómo calcular la distancia de Levenshtein en R?

En este artículo, discutiremos cómo calcular la distancia de Levenshtein en el lenguaje de programación R. 

La distancia de Levenshtein entre dos strings es el número mínimo de sustituciones, inserciones y eliminaciones de caracteres necesarias para convertir una string en otra string. La distancia de Levenshtein se usa prácticamente en coincidencias aproximadas de strings, revisión ortográfica, procesamiento de lenguaje natural, etc.

Para calcular la distancia de Levenshtein en el lenguaje R, usamos la función stringdist() de la biblioteca del paquete stringdist. El paquete stringdist es una biblioteca de lenguaje R que contiene funciones aproximadas de coincidencia de strings, búsqueda de texto difuso y distancia de strings. La función stringdist() calcula distancias de strings por pares entre dos o más strings, vectores o columnas de marcos de datos.

Distancia de Levenshtein entre dos cuerdas

Para calcular la distancia de Levenshtein en el lenguaje R, usamos la función stringdist() de la biblioteca del paquete stringdist. La función stringdist() toma dos strings como argumentos y devuelve la distancia de Levenshtein entre ellas.

Sintaxis: stringdist(string1, string2, método=”lv” )

Parámetro:

  • string1 y string2: determinan la string cuya distancia de Levenshtein se va a calcular.

Ejemplo: Aquí, calcularemos la distancia de Levenshtein entre dos cuerdas.

R

# load library stringdist
library(stringdist)
  
# sample strings
string1= "Priyank"
string2= "geeksforgeeks"
  
# calculate Levenshtein Distance
stringdist(string1, string2, method = 'lv')

Producción:

Distancia de Levenshtein entre dos vectores de cuerda:

Para calcular la distancia de Levenshtein entre dos vectores en el lenguaje R, usamos la función stringdist() de la biblioteca del paquete stringdist. La función stringdist() toma dos vectores de string como argumentos y devuelve un vector que contiene la distancia de Levenshtein entre cada par de strings en ellos.

Sintaxis: stringdist( string_vec1, string_vec2, method=”lv” )

Parámetro:

  • string_vec1 y string_vec2: determinan los vectores de string cuya distancia de Levenshtein se desea calcular.

Ejemplo: aquí, calcularemos la distancia de Levenshtein entre dos vectores de cuerda.

R

# load library stringdist
library(stringdist)
  
# sample strings
string_vec1<- c("Priyank", "Abhiraj", "Sudhanshu")
string_vec2<- c("geeksforgeeks", "Devraj", "Pawan")
  
# calculate Levenshtein Distance
stringdist(string_vec1, string_vec2, method = 'lv')

Producción:

Distancia de Levenshtein entre dos columnas de string de un marco de datos

Para calcular la distancia de Levenshtein entre dos columnas de strings de un marco de datos en el lenguaje R, usamos la función stringdist() de la biblioteca del paquete stringdist. La función stringdist() toma dos columnas de strings de un marco de datos como argumentos y devuelve un vector que contiene la distancia de Levenshtein entre ellas. 

Sintaxis: stringdist( string_data$column1, string_data$column2, method=”lv” )

Parámetros:

  • string_data: determina el marco de datos que contiene columnas de string.
  • columna1 y columna2: determina las columnas de string del marco de datos cuya distancia de Levenshtein se va a calcular.

Ejemplo: aquí, calcularemos la distancia de Levenshtein entre dos columnas de strings de un marco de datos.

R

# load library stringdist
library(stringdist)
  
# sample string data frame
string_data<- data.frame(one= c("Priyank", 
                                "Abhiraj", "Sudhanshu"),
                         two= c("geeksforgeeks", 
                                "Devraj", "Pawan"))
  
# calculate Levenshtein Distance
string_data$levenshtein<-stringdist(string_data$one, 
                                    string_data$two,
                                    method = 'lv')
  
# print data frame
 string_data

Producción:

Publicación traducida automáticamente

Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *