La Inteligencia Artificial, definida como la inteligencia exhibida por las máquinas, tiene muchas aplicaciones en la sociedad actual. Una de sus aplicaciones más utilizadas es la generación de lenguaje natural.
N atural Language G eneration (NLG) simplemente significa producir texto a partir de datos informáticos . Actúa como un traductor y convierte los datos computarizados en representación de lenguaje natural. En esto, se genera una conclusión o texto sobre la base de los datos recopilados y la entrada proporcionada por el usuario. Es la tarea de procesamiento de lenguaje natural de generar lenguaje natural a partir de un sistema de representación de máquina. La Generación del Lenguaje Natural actúa de alguna manera contraria a la comprensión del Lenguaje Natural. En la comprensión del lenguaje natural, el sistema necesita eliminar la ambigüedad de la oración de entrada para producir el lenguaje de representación de la máquina, mientras que en la Generación del lenguaje natural, el sistema necesita tomar decisiones sobre cómo poner un concepto en palabras.
El proceso para generar texto puede ser tan simple como mantener una lista de texto preparado que se copia y pega. Las consecuencias pueden ser satisfactorias en aplicaciones simples como máquinas de horóscopos o generadores de cartas comerciales personalizadas. Pero en un sistema NLG sofisticado, se requiere incluir etapas de planificación y la combinación de información genera un texto que se ve natural y no se vuelve repetitivo.
Un ejemplo de un sistema NLG simple es el sistema Pronóstico de polen para Escocia, que básicamente podría ser una plantilla. El sistema NLG toma como entrada seis números, que predicen los niveles de polen en diferentes partes de Escocia. A partir de estos números, el sistema genera un breve resumen textual de los niveles de polen como resultado.
Por ejemplo, utilizando los datos históricos del 1 de julio de 2005, el software produce niveles de polen de hierba para el viernes que aumentaron de los niveles moderados a altos de ayer con valores de alrededor de 6 a 7 en la mayor parte del país. Sin embargo, los niveles de polen serán moderados con valores de 4, en las zonas del norte. En contraste, el pronóstico real, que fue escrito por un meteorólogo humano, a partir de estos datos, se espera que los recuentos de polen se mantengan altos en el nivel 6 en la mayor parte de Escocia, e incluso en el nivel 7 en el sureste. El único alivio se encuentra en las Islas del Norte y en el extremo noreste de Escocia continental con niveles medios de recuento de polen.
Las etapas típicas de la generación del lenguaje natural son:
- Determinación del contenido: Decidir el contenido principal a representar en una oración o la información a mencionar en el texto. Por ejemplo, en el ejemplo anterior del polen, decidir si mencionar explícitamente que el nivel de polen es 7 en el sureste.
- Estructuración de documentos: Decidir la estructura u organización de la información transmitida. Por ejemplo, decidir describir primero las áreas con niveles altos de polen, en lugar de las áreas con niveles bajos de polen.
- Agregación: Juntar oraciones similares para mejorar la comprensión y la legibilidad. Por ejemplo, fusionando las dos oraciones Los niveles de polen de pasto para el viernes aumentaron de los niveles moderados a altos de ayer y los niveles de polen de pasto serán de alrededor de 6 a 7 en la mayor parte del país en la oración única Los niveles de polen de pasto para el viernes aumentaron de los niveles moderados a altos de ayer con valores de alrededor de 6 a 7 en la mayor parte del país.
- Elección léxica: Usar palabras apropiadas que transmitan el significado con claridad. Por ejemplo, decidir si se debe usar medio o moderado al describir un nivel de polen de 4.
- Generación de expresiones de referencia: creación de expresiones de referencia que ayuden a identificar un objeto y una región en particular. Por ejemplo, decidir usar en las Islas del Norte y el extremo noreste de Escocia continental para referirse a una determinada región de Escocia. Esta tarea también incluye la toma de decisiones sobre pronombres y otros tipos de anáforas.
- Realización: Crear y optimizar el texto que debe ser correcto según las reglas de la gramática. Por ejemplo, usar será para el tiempo futuro de ser.
Hay tres técnicas básicas para evaluar los sistemas NLG:
- Evaluación basada en tareas: incluye la evaluación basada en humanos, quienes evalúan qué tan bien le ayuda a realizar una tarea. Por ejemplo, un sistema que genera resúmenes de datos médicos puede evaluarse entregando estos resúmenes a los médicos y evaluando si los resúmenes ayudan a los médicos a tomar mejores decisiones.
- Calificaciones humanas: Evalúa el texto generado en base a las calificaciones otorgadas por una persona sobre la calidad y utilidad del texto.
- Métricas: Compara textos generados con textos escritos por profesionales.
Un ejemplo de un uso interactivo de la generación de lenguaje natural es el marco WYSIWYM, que significa » Lo que ves es lo que quisiste decir «. Permite a los usuarios ver y manipular la vista continuamente representada (salida NLG) de un documento de lenguaje formal subyacente (NLG). input), editando así el lenguaje formal sin aprenderlo.
Otro ejemplo incluye los sistemas de generación de contenido que ayudan a los escritores humanos y hacen que el proceso de escritura sea más eficiente y efectivo. Se ha construido una herramienta de generación de contenidos basada en web mining utilizando APIs de motores de búsqueda. La herramienta imita el escenario de escritura de cortar y pegar donde un escritor forma su contenido a partir de varios resultados de búsqueda.
Hasta ahora, las aplicaciones de NLG más exitosas han sido los sistemas Data-to-Text , que generan resúmenes textuales de bases de datos y conjuntos de datos; estos sistemas generalmente realizan análisis de datos así como también generación de texto. En particular, se han construido varios sistemas que producen pronósticos meteorológicos textuales a partir de datos meteorológicos.
Referencia: Wikipedia
Publicación traducida automáticamente
Artículo escrito por Himanshi_Singh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA