ParseContextClass en Java

La clase ParseContext es un componente del paquete Java org.apache.tika.parser, que se utiliza para analizar el contexto y pasarlo a los analizadores Tika  (el kit de herramientas Apache Tika detecta y extrae metadatos y texto de más de mil tipos de archivos diferentes). org.apache.tika.parser.ParseContext implementa una interfaz serializable.

public class ParseContext extends Object implements Serializable

Constructor:

1. ParseContext(): ParseContext() inicializa una nueva instancia de la clase ParseContext.

ParseContext p = new ParseContext()

Nota: p es la nueva instancia de la clase ParseContext.

Métodos de ParseContext –

     S. No.        

 Método                       

 Descripción                                                                     

Tipo de retorno                                                

1.

getDocumentBuilder() getDocumentBuilder() devuelve el constructor DOM especificado en este contexto de análisis. Creador de documentos

2.

getSAXParser() getSAXParser() devuelve el analizador SAX especificado en este contexto de análisis. SAXParser

3.

getSAXParserFactory() getSAXParserFactory() devuelve la fábrica de analizadores SAX especificada en este contexto de análisis. SAXParserFactory

4.

obtenerTransformador() getTransformer() devuelve el transformador especificado en este contexto de análisis. Transformador

5.

 getXMLInputFactory()  getXMLInputFactory() devuelve la fábrica de entrada StAX especificada en este contexto de análisis. XMLInputFactory

6.

getXMLReader() getXMLReader() devuelve el XMLReader especificado en este contexto de análisis. Lector XML

7.

get (Clase <T> clave)              get(Class<T> key) devuelve el objeto en este contexto que implementa la interfaz dada. <T> T

8.

get (Clase <T> clave, T valor predeterminado) get(Class<T> key, T defaultValue) devuelve el objeto en este contexto que implementa la interfaz dada. <T> T

9.

 set (Clase <T> clave, valor T)  set(Class<T> key, T value) agrega el valor dado al contexto para implementar la interfaz dada. <T> vacío

Ejemplo:

Java

// Java Program To Get Content of the
// document using Tika Toolkit and 
// ContextParser:
import java.io.*;
  
// importing File class
import java.io.File.*;
import org.apache.tika.exception.TikaException;
import org.apache.tika.metadata.Metadata;
import org.apache.tika.parser.ParseContext;
import org.apache.tika.parser.txt.TXTParser;
import org.apache.tika.sax.BodyContentHandler;
// import the necessary Tika packages
import org.xml.sax.SAXException;
  
class GFG {
    public static void main(String[] args)
    {
        // new instance of FIle is created
        File fileName = new File("tmp.txt");
        
        // new instance of FileInputStream is created for
        // reading purpose
        FileInputStream fileInputStream
            = new FileInputStream(fileName);
        
        // new instance of parseContext class is created
        ParseContext parseContext = new ParseContext();
        
        // new instance of MetaData is created
        MetaData metaData = new MetaData();
        
        // new instance of TXTParser is created for plain
        // text parsing purpose
        TXTParser textParser = new TXTParser();
        
        // new instance of BodyContentHandler is created
        BodyContentHandler bodyContentHandler
            = new BodyContentHandler();
        
        // TXTParser parse method is called for parsing a
        // document stream into sequence of XHTML SAX events.
        textParser.parse(fileInputStream,
                         bodyContentHandler, metaData,
                         parseContext);
  
        System.out.println("Contents of the document:"
                           + bodyContenthandler.toString());
    }
}

Producción-

Contents of the document:GFG is the best website for programmer

Nota: el archivo tmp.txt contiene los siguientes datos.

Publicación traducida automáticamente

Artículo escrito por harshsethi2000 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *