Python | NLTK nltk.tokenize.ConditionalFreqDist()

Con la ayuda del nltk.tokenize.ConditionalFreqDist()método, podemos contar la frecuencia de las palabras en una oración usando el tokenize.ConditionalFreqDist()método.

Sintaxis: tokenize.ConditionalFreqDist()
Retorno: Retorna la distribución de frecuencia de las palabras en un diccionario.

Ejemplo #1:
En este ejemplo, podemos ver que al usar el tokenize.ConditionalFreqDist()método, podemos contar la aparición de palabras en una oración.

# import ConditionalFreqDist() method from nltk
from nltk.probability import ConditionalFreqDist
from nltk.tokenize import word_tokenize
     
# Create a reference variable for Class SExprTokenizer
tk = ConditionalFreqDist()
     
# Create a string input
gfg = "Geeks for Geeks"
     
for word in word_tokenize(gfg):
   condition = len(word)
   tk[condition][word] += 1
     
print(tk)

Producción :

FreqDist({‘Geeks’: 2, ‘for’: 1})

Ejemplo #2:

# import ConditionalFreqDist() method from nltk
from nltk.probability import ConditionalFreqDist
from nltk.tokenize import word_tokenize
     
# Create a reference variable for Class SExprTokenizer
tk = ConditionalFreqDist()
     
# Create a string input
gfg = "G F G"
     
for word in word_tokenize(gfg):
   condition = len(word)
   tk[condition][word] += 1
     
print(tk)

Producción :

DistFrecuencia({‘G’: 2, ‘F’: 1})

Publicación traducida automáticamente

Artículo escrito por Jitender_1998 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *