Similitud basada en ruta: es una medida de similitud que encuentra la distancia que es la longitud de la ruta más corta entre dos synsets.
Leacock Chordorow (LCH): es una medida de similitud que es una versión extendida de la similitud basada en rutas, ya que incorpora la profundidad de la taxonomía. Por lo tanto, es el logaritmo negativo del camino más corto (spath) entre dos conceptos (synset_1 y synset_2) dividido por el doble de la profundidad total de la taxonomía (D) como se define en la figura a continuación.
Código #1: Presentamos Synsets.
from nltk.corpus import wordnet syn1 = wordnet.synsets('hello')[0] syn2 = wordnet.synsets('selling')[0] print ("hello name : ", syn1.name()) print ("selling name : ", syn2.name())
Producción :
hello name : hello.n.01 selling name : selling.n.01
Código #2: Similitud de ruta
syn1.path_similarity(syn2)
Producción :
0.08333333333333333
Código #3: Similitud de Leacock Chordorow (LCH)
syn1.lch_similarity(syn2)
Producción :
1.1526795099383855
Publicación traducida automáticamente
Artículo escrito por Mohit Gupta_OMG 🙂 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA