Sentimientos en texto: codificaciones basadas en palabras

El análisis sentimental es el procesamiento de describir si un sentimiento particular o una opinión es positiva, negativa o neutral. Por ejemplo, «Odio mi almuerzo», «Me encanta mi almuerzo» y «Estoy bien con mi almuerzo». Hay un tono negativo, positivo y neutral en cada una de estas oraciones. A gran escala, el Análisis Sentimental se utiliza para determinar la retroalimentación del cliente a través de comentarios. Estos comentarios ayudan a construir sistemas de recomendación para futuras referencias.

¿Cómo obtener el significado de una palabra en una oración?

Podríamos haber tomado valores ASCII de un carácter, pero ¿nos ayudaría eso a entender la semántica de una palabra?. Tomemos en consideración la palabra “binario”, también se puede escribir como “cerebro”. Claramente, ambas palabras comparten el mismo valor ASCII pero tienen un significado completamente diferente. Es una tarea difícil entrenar una red neuronal con palabras. La solución a todo esto es si pudiéramos darle valor a las palabras y usarlas en el modelo de entrenamiento

Considere esta oración «Me encanta mi almuerzo», démosle un número aleatorio. Digamos que los valores son 1, 2, 3 y 4 respectivamente. Digamos que tenemos otra oración que es «Amo a mi gato», podemos reutilizar los valores anteriores y darle un nuevo token a la palabra «gato». Digamos que el valor del gato es 5. Hay una similitud de 4 valores en ambas oraciones. Es un comienzo sobre cómo entrenar una red neuronal. Afortunadamente, tenemos API como Tensorflow . Siga los pasos a continuación para entrenar su modelo

  • Paso 1: Importación de bibliotecas requeridas
  • Paso 2: crea una lista de oraciones
  • Paso 3: Crea un objeto Tokenizer
  • Paso 4: Usa el método fit_on_text
  • Paso 5: imprime el word_index

A continuación se muestra la implementación.

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.preprocessing.text import Tokenizer
  
sentences = [
    "I love my lunch",
    "I love my cat !"
]
  
tokenizer = Tokenizer(num_words = 100)
tokenizer.fit_on_texts(sentences)
word_index = tokenizer.word_index
  
print(word_index)

Producción:

{'i': 1, 'love': 2, 'my': 3, 'lunch': 4, 'cat': 5}

Publicación traducida automáticamente

Artículo escrito por sunaina7571 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *