La clase ParseContext es un componente del paquete Java org.apache.tika.parser, que se utiliza para analizar el contexto y pasarlo a los analizadores Tika (el kit de herramientas Apache Tika detecta y extrae metadatos y texto de más de mil tipos de archivos diferentes). org.apache.tika.parser.ParseContext implementa una interfaz serializable.
public class ParseContext extends Object implements Serializable
Constructor:
1. ParseContext(): ParseContext() inicializa una nueva instancia de la clase ParseContext.
ParseContext p = new ParseContext()
Nota: p es la nueva instancia de la clase ParseContext.
Métodos de ParseContext –
S. No. |
Método |
Descripción |
Tipo de retorno |
---|---|---|---|
1. |
getDocumentBuilder() | getDocumentBuilder() devuelve el constructor DOM especificado en este contexto de análisis. | Creador de documentos |
2. |
getSAXParser() | getSAXParser() devuelve el analizador SAX especificado en este contexto de análisis. | SAXParser |
3. |
getSAXParserFactory() | getSAXParserFactory() devuelve la fábrica de analizadores SAX especificada en este contexto de análisis. | SAXParserFactory |
4. |
obtenerTransformador() | getTransformer() devuelve el transformador especificado en este contexto de análisis. | Transformador |
5. |
getXMLInputFactory() | getXMLInputFactory() devuelve la fábrica de entrada StAX especificada en este contexto de análisis. | XMLInputFactory |
6. |
getXMLReader() | getXMLReader() devuelve el XMLReader especificado en este contexto de análisis. | Lector XML |
7. |
get (Clase <T> clave) | get(Class<T> key) devuelve el objeto en este contexto que implementa la interfaz dada. | <T> T |
8. |
get (Clase <T> clave, T valor predeterminado) | get(Class<T> key, T defaultValue) devuelve el objeto en este contexto que implementa la interfaz dada. | <T> T |
9. |
set (Clase <T> clave, valor T) | set(Class<T> key, T value) agrega el valor dado al contexto para implementar la interfaz dada. | <T> vacío |
Ejemplo:
Java
// Java Program To Get Content of the // document using Tika Toolkit and // ContextParser: import java.io.*; // importing File class import java.io.File.*; import org.apache.tika.exception.TikaException; import org.apache.tika.metadata.Metadata; import org.apache.tika.parser.ParseContext; import org.apache.tika.parser.txt.TXTParser; import org.apache.tika.sax.BodyContentHandler; // import the necessary Tika packages import org.xml.sax.SAXException; class GFG { public static void main(String[] args) { // new instance of FIle is created File fileName = new File("tmp.txt"); // new instance of FileInputStream is created for // reading purpose FileInputStream fileInputStream = new FileInputStream(fileName); // new instance of parseContext class is created ParseContext parseContext = new ParseContext(); // new instance of MetaData is created MetaData metaData = new MetaData(); // new instance of TXTParser is created for plain // text parsing purpose TXTParser textParser = new TXTParser(); // new instance of BodyContentHandler is created BodyContentHandler bodyContentHandler = new BodyContentHandler(); // TXTParser parse method is called for parsing a // document stream into sequence of XHTML SAX events. textParser.parse(fileInputStream, bodyContentHandler, metaData, parseContext); System.out.println("Contents of the document:" + bodyContenthandler.toString()); } }
Producción-
Contents of the document:GFG is the best website for programmer
Nota: el archivo tmp.txt contiene los siguientes datos.
Publicación traducida automáticamente
Artículo escrito por harshsethi2000 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA