En este artículo, discutiremos cómo calcular la distancia de Levenshtein en el lenguaje de programación R.
La distancia de Levenshtein entre dos strings es el número mínimo de sustituciones, inserciones y eliminaciones de caracteres necesarias para convertir una string en otra string. La distancia de Levenshtein se usa prácticamente en coincidencias aproximadas de strings, revisión ortográfica, procesamiento de lenguaje natural, etc.
Para calcular la distancia de Levenshtein en el lenguaje R, usamos la función stringdist() de la biblioteca del paquete stringdist. El paquete stringdist es una biblioteca de lenguaje R que contiene funciones aproximadas de coincidencia de strings, búsqueda de texto difuso y distancia de strings. La función stringdist() calcula distancias de strings por pares entre dos o más strings, vectores o columnas de marcos de datos.
Distancia de Levenshtein entre dos cuerdas
Para calcular la distancia de Levenshtein en el lenguaje R, usamos la función stringdist() de la biblioteca del paquete stringdist. La función stringdist() toma dos strings como argumentos y devuelve la distancia de Levenshtein entre ellas.
Sintaxis: stringdist(string1, string2, método=”lv” )
Parámetro:
- string1 y string2: determinan la string cuya distancia de Levenshtein se va a calcular.
Ejemplo: Aquí, calcularemos la distancia de Levenshtein entre dos cuerdas.
R
# load library stringdist library(stringdist) # sample strings string1= "Priyank" string2= "geeksforgeeks" # calculate Levenshtein Distance stringdist(string1, string2, method = 'lv')
Producción:
Distancia de Levenshtein entre dos vectores de cuerda:
Para calcular la distancia de Levenshtein entre dos vectores en el lenguaje R, usamos la función stringdist() de la biblioteca del paquete stringdist. La función stringdist() toma dos vectores de string como argumentos y devuelve un vector que contiene la distancia de Levenshtein entre cada par de strings en ellos.
Sintaxis: stringdist( string_vec1, string_vec2, method=”lv” )
Parámetro:
- string_vec1 y string_vec2: determinan los vectores de string cuya distancia de Levenshtein se desea calcular.
Ejemplo: aquí, calcularemos la distancia de Levenshtein entre dos vectores de cuerda.
R
# load library stringdist library(stringdist) # sample strings string_vec1<- c("Priyank", "Abhiraj", "Sudhanshu") string_vec2<- c("geeksforgeeks", "Devraj", "Pawan") # calculate Levenshtein Distance stringdist(string_vec1, string_vec2, method = 'lv')
Producción:
Distancia de Levenshtein entre dos columnas de string de un marco de datos
Para calcular la distancia de Levenshtein entre dos columnas de strings de un marco de datos en el lenguaje R, usamos la función stringdist() de la biblioteca del paquete stringdist. La función stringdist() toma dos columnas de strings de un marco de datos como argumentos y devuelve un vector que contiene la distancia de Levenshtein entre ellas.
Sintaxis: stringdist( string_data$column1, string_data$column2, method=”lv” )
Parámetros:
- string_data: determina el marco de datos que contiene columnas de string.
- columna1 y columna2: determina las columnas de string del marco de datos cuya distancia de Levenshtein se va a calcular.
Ejemplo: aquí, calcularemos la distancia de Levenshtein entre dos columnas de strings de un marco de datos.
R
# load library stringdist library(stringdist) # sample string data frame string_data<- data.frame(one= c("Priyank", "Abhiraj", "Sudhanshu"), two= c("geeksforgeeks", "Devraj", "Pawan")) # calculate Levenshtein Distance string_data$levenshtein<-stringdist(string_data$one, string_data$two, method = 'lv') # print data frame string_data
Producción:
Publicación traducida automáticamente
Artículo escrito por mishrapriyank17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA