Clase de contexto de análisis en Java

La clase ParseContext es un componente de los paquetes de Java org.apache.tika.parser, que se utiliza para analizar el contexto y pasarlo a Tika (el kit de herramientas de Apache Tika que detecta y extrae los metadatos y el texto de más de mil tipos de archivos diferentes ) analizadores org.apache.tika.parser.ParseContext implementa una interfaz Serializable.

El contexto del analizador es otro concepto más. Se crea una instancia (objeto) de la clase de contexto Parse antes de que un no terminal comience el análisis y se destruye después de que el análisis haya concluido.

El contexto se proporciona para la extensibilidad. tiene el propósito principal de exponer el inicio y el final de la función de miembro de análisis del no terminal para acomodar ganchos externos. Podemos extender el no terminal de muchas maneras escribiendo clases de contexto especializadas, sin modificar la clase en sí. Por ejemplo, podemos hacer que el no terminal emita información de diagnóstico de depuración escribiendo para una clase de contexto que imprima el estado actual del escáner en cada punto del recorrido de análisis donde invoca el no terminal.

Class ParseContext- org.apache.tika.parser
All Implemented Interfaces:  Serializable
Class ParseContext -java.lang.Object org.apache.tika.parser.ParseContext

El contexto Parse Usar pasar información de contexto a los analizadores Tika

Sintaxis:

public class ParseContext extends Object implements Serializable

Constructor de la clase de contexto Parse

1. ParseContext(): The Constructor ParseContext() inicializa una nueva instancia de la clase The ParseContext. Por ejemplo:

ParseContext ab = new ParseContext()

Nota: ab es la nueva instancia de la clase ParseContext

Métodos de la clase de contexto Parse

Método Descripción
 get (Clase <T> clave) Devolviendo el objeto en este contexto que implementa la interfaz dada
 getDocumentBuilder()  Devolver el constructor DOM especificado en este contexto de análisis
 getSAXParser() Devolviendo el analizador SAX especificado en este contexto de análisis
getSAXParserFactory() Devolver la fábrica de analizador SAX especificada en este contexto de análisis
obtenerTransformador() Devolviendo el transformador especificado en este contexto de análisis
getXMLInputFactory() Devolver la fábrica de entrada StAX especificada en este contexto de análisis
getXMLReader() Devolviendo el XMLReader especificado en este contexto de análisis
 set (Clase <T> clave, valor T) Agregar el valor dado al contexto como una implementación de las interfaces dadas
get (Clase <T> clave, T valor predeterminado) Devolviendo los objetos en este contexto que implementan la interfaz dada, o el valor predeterminado dado si no se encuentra dicho objeto

Ejemplo:

Java

// Java Program To Getting Content of Document
// Using Tika Toolkit and ContextParser
 
// Importing required classes
import java.io.*;
import java.io.File.*;
import org.apache.tika.exception.TikaException;
import org.apache.tika.metadata.Metadata;
import org.apache.tika.parser.ParseContext;
import org.apache.tika.parser.txt.TXTParser;
import org.apache.tika.sax.BodyContentHandler;
// Importing necessary Tika packages to it
import org.xml.sax.SAXException;
 
// Main class
class Cowin {
 
    // Main driver method
    public static void main(String[] args)
    {
 
        // Creating a File
        File fileName = new File("abc.txt");
 
        // Instance of File created using new keyword
        FileInputStream fileInputStream
            = new FileInputStream(fileName);
 
        ParseContext parseContext = new ParseContext();
        // new instance of parseContext class is created
 
        MetaData metaData = new MetaData();
 
        // Instance of MetaData is created
        TXTParser textParser = new TXTParser();
 
        // Instance of BodyContentHandler is created for it
        BodyContentHandler bodyContentHandler
            = new BodyContentHandler();
 
        // TXTParser parse method is called for parsing to
        // it
        textParser.parse(fileInputStream,
                         bodyContentHandler, metaData,
                         parseContext);
 
        System.out.println("Contents in the File="
                           + bodyContenthandler.toString());
    }
}

Producción:

Contents in the File= Cowin is the webportal for Vaccination

El archivo abc.txt contiene los siguientes datos:

Publicación traducida automáticamente

Artículo escrito por khurpaderushi143 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *