Con la ayuda del nltk.tokenize.ConditionalFreqDist()
método, podemos contar la frecuencia de las palabras en una oración usando el tokenize.ConditionalFreqDist()
método.
Sintaxis:
tokenize.ConditionalFreqDist()
Retorno: Retorna la distribución de frecuencia de las palabras en un diccionario.
Ejemplo #1:
En este ejemplo, podemos ver que al usar el tokenize.ConditionalFreqDist()
método, podemos contar la aparición de palabras en una oración.
# import ConditionalFreqDist() method from nltk from nltk.probability import ConditionalFreqDist from nltk.tokenize import word_tokenize # Create a reference variable for Class SExprTokenizer tk = ConditionalFreqDist() # Create a string input gfg = "Geeks for Geeks" for word in word_tokenize(gfg): condition = len(word) tk[condition][word] += 1 print(tk)
Producción :
FreqDist({‘Geeks’: 2, ‘for’: 1})
Ejemplo #2:
# import ConditionalFreqDist() method from nltk from nltk.probability import ConditionalFreqDist from nltk.tokenize import word_tokenize # Create a reference variable for Class SExprTokenizer tk = ConditionalFreqDist() # Create a string input gfg = "G F G" for word in word_tokenize(gfg): condition = len(word) tk[condition][word] += 1 print(tk)
Producción :
DistFrecuencia({‘G’: 2, ‘F’: 1})
Publicación traducida automáticamente
Artículo escrito por Jitender_1998 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA