PNL | Leacock Chordorow (LCH) y similitud de ruta para Synset

Similitud basada en ruta: es una medida de similitud que encuentra la distancia que es la longitud de la ruta más corta entre dos synsets.

Leacock Chordorow (LCH): es una medida de similitud que es una versión extendida de la similitud basada en rutas, ya que incorpora la profundidad de la taxonomía. Por lo tanto, es el logaritmo negativo del camino más corto (spath) entre dos conceptos (synset_1 y synset_2) dividido por el doble de la profundidad total de la taxonomía (D) como se define en la figura a continuación.

Código #1: Presentamos Synsets.

from nltk.corpus import wordnet 
  
syn1 = wordnet.synsets('hello')[0] 
syn2 = wordnet.synsets('selling')[0] 
  
print ("hello name : ", syn1.name()) 
print ("selling name : ", syn2.name()) 

Producción :

hello name :   hello.n.01
selling name :   selling.n.01

 
Código #2: Similitud de ruta

syn1.path_similarity(syn2) 

Producción :

0.08333333333333333

 
Código #3: Similitud de Leacock Chordorow (LCH)

syn1.lch_similarity(syn2) 

Producción :

1.1526795099383855

Publicación traducida automáticamente

Artículo escrito por Mohit Gupta_OMG 🙂 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *