La clase ParseContext es un componente de los paquetes de Java org.apache.tika.parser, que se utiliza para analizar el contexto y pasarlo a Tika (el kit de herramientas de Apache Tika que detecta y extrae los metadatos y el texto de más de mil tipos de archivos diferentes ) analizadores org.apache.tika.parser.ParseContext implementa una interfaz Serializable.
El contexto del analizador es otro concepto más. Se crea una instancia (objeto) de la clase de contexto Parse antes de que un no terminal comience el análisis y se destruye después de que el análisis haya concluido.
El contexto se proporciona para la extensibilidad. tiene el propósito principal de exponer el inicio y el final de la función de miembro de análisis del no terminal para acomodar ganchos externos. Podemos extender el no terminal de muchas maneras escribiendo clases de contexto especializadas, sin modificar la clase en sí. Por ejemplo, podemos hacer que el no terminal emita información de diagnóstico de depuración escribiendo para una clase de contexto que imprima el estado actual del escáner en cada punto del recorrido de análisis donde invoca el no terminal.
Class ParseContext- org.apache.tika.parser All Implemented Interfaces: Serializable Class ParseContext -java.lang.Object org.apache.tika.parser.ParseContext
El contexto Parse Usar pasar información de contexto a los analizadores Tika
Sintaxis:
public class ParseContext extends Object implements Serializable
Constructor de la clase de contexto Parse
1. ParseContext(): The Constructor ParseContext() inicializa una nueva instancia de la clase The ParseContext. Por ejemplo:
ParseContext ab = new ParseContext()
Nota: ab es la nueva instancia de la clase ParseContext
Métodos de la clase de contexto Parse
Método | Descripción |
---|---|
get (Clase <T> clave) | Devolviendo el objeto en este contexto que implementa la interfaz dada |
getDocumentBuilder() | Devolver el constructor DOM especificado en este contexto de análisis |
getSAXParser() | Devolviendo el analizador SAX especificado en este contexto de análisis |
getSAXParserFactory() | Devolver la fábrica de analizador SAX especificada en este contexto de análisis |
obtenerTransformador() | Devolviendo el transformador especificado en este contexto de análisis |
getXMLInputFactory() | Devolver la fábrica de entrada StAX especificada en este contexto de análisis |
getXMLReader() | Devolviendo el XMLReader especificado en este contexto de análisis |
set (Clase <T> clave, valor T) | Agregar el valor dado al contexto como una implementación de las interfaces dadas |
get (Clase <T> clave, T valor predeterminado) | Devolviendo los objetos en este contexto que implementan la interfaz dada, o el valor predeterminado dado si no se encuentra dicho objeto |
Ejemplo:
Java
// Java Program To Getting Content of Document // Using Tika Toolkit and ContextParser // Importing required classes import java.io.*; import java.io.File.*; import org.apache.tika.exception.TikaException; import org.apache.tika.metadata.Metadata; import org.apache.tika.parser.ParseContext; import org.apache.tika.parser.txt.TXTParser; import org.apache.tika.sax.BodyContentHandler; // Importing necessary Tika packages to it import org.xml.sax.SAXException; // Main class class Cowin { // Main driver method public static void main(String[] args) { // Creating a File File fileName = new File("abc.txt"); // Instance of File created using new keyword FileInputStream fileInputStream = new FileInputStream(fileName); ParseContext parseContext = new ParseContext(); // new instance of parseContext class is created MetaData metaData = new MetaData(); // Instance of MetaData is created TXTParser textParser = new TXTParser(); // Instance of BodyContentHandler is created for it BodyContentHandler bodyContentHandler = new BodyContentHandler(); // TXTParser parse method is called for parsing to // it textParser.parse(fileInputStream, bodyContentHandler, metaData, parseContext); System.out.println("Contents in the File=" + bodyContenthandler.toString()); } }
Producción:
Contents in the File= Cowin is the webportal for Vaccination
El archivo abc.txt contiene los siguientes datos:
Publicación traducida automáticamente
Artículo escrito por khurpaderushi143 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA