Extraiga datos de un archivo PDF usando Android Jetpack Compose

Los archivos PDF se utilizan en muchas aplicaciones de Android para mostrar datos en forma de imágenes, texto y gráficos. También se requieren muchas aplicaciones para obtener los datos de este archivo PDF y mostrar estos datos dentro de la aplicación de Android. Entonces, para extraer los datos del archivo PDF, se usa el lector de PDF, que se usa para leer pdf y obtener los datos del archivo PDF. En este artículo, construiremos una aplicación simple en la que extraeremos datos de archivos PDF en Android Jetpack Compose .

Implementación paso a paso

Paso 1: crea un nuevo proyecto en Android Studio

Para crear un nuevo proyecto en Android Studio, consulte Cómo crear/iniciar un nuevo proyecto en Android Studio . Al elegir la plantilla, seleccione Actividad de composición vacía . Si no encuentra esta plantilla, intente actualizar Android Studio a la última versión. Demostramos la aplicación en Kotlin, así que asegúrese de seleccionar Kotlin como idioma principal al crear un nuevo proyecto.

Paso 2: Agregar un nuevo color en el archivo Color.kt

Vaya a la aplicación > java > el nombre del paquete de su aplicación > ui.theme > archivo Color.kt y agréguele el siguiente código.

Kotlin

package com.example.newcanaryproject.ui.theme
  
import androidx.compose.ui.graphics.Color
  
val Purple200 = Color(0xFF0F9D58)
val Purple500 = Color(0xFF0F9D58)
val Purple700 = Color(0xFF3700B3)
val Teal200 = Color(0xFF03DAC5)
  
// on below line we are adding different colors.
val greenColor = Color(0xFF0F9D58)

Paso 3: Agregar dependencia en el archivo build.gradle 

Vaya a Gradle Scripts > build.gradle y agregue la siguiente dependencia en el archivo build.gradle. 

implementation 'com.itextpdf:itextg:5.5.10'

Después de agregar esta dependencia, simplemente sincronice su proyecto para instalarlo. 

Paso 4: agregar un archivo PDF a su proyecto

Como estamos extrayendo datos de archivos PDF, agregaremos archivos PDF a nuestra aplicación. Para agregar archivos PDF a su aplicación, primero debemos crear la carpeta sin procesar. Consulte Carpeta sin procesar de recursos en Android Studio para crear una carpeta sin procesar en Android. Después de crear un nuevo directorio sin procesar, copie y pegue su archivo PDF dentro de esa carpeta «sin procesar».

Paso 5: trabajar con el archivo MainActivity.kt

Vaya al archivo MainActivity.kt y consulte el siguiente código. A continuación se muestra el código del archivo MainActivity.kt . Se agregan comentarios dentro del código para comprender el código con más detalle.

Kotlin

package com.example.newcanaryproject
  
import android.os.Bundle
import android.util.Log
import androidx.activity.ComponentActivity
import androidx.activity.compose.setContent
import androidx.compose.foundation.layout.*
import androidx.compose.material.*
import androidx.compose.runtime.*
import androidx.compose.ui.Alignment
import androidx.compose.ui.Modifier
import androidx.compose.ui.graphics.Color
import androidx.compose.ui.platform.LocalContext
import androidx.compose.ui.text.font.FontWeight
import androidx.compose.ui.text.style.TextAlign
import androidx.compose.ui.unit.*
import com.example.newcanaryproject.ui.theme.*
import com.itextpdf.text.pdf.PdfReader
import com.itextpdf.text.pdf.parser.PdfTextExtractor
  
class MainActivity : ComponentActivity() {
  
    override fun onCreate(savedInstanceState: Bundle?) {
        super.onCreate(savedInstanceState)
        setContent {
            NewCanaryProjectTheme {
                // on below line we are specifying
                // background color for our application
                Surface(
                    // on below line we are specifying 
                    // modifier and color for our app
                    modifier = Modifier.fillMaxSize(),
                    color = MaterialTheme.colors.background
                ) {
  
                    // on below line we are specifying the theme as scaffold.
                    Scaffold(
  
                        // in scaffold we are specifying top bar.
                        topBar = {
  
                            // inside top bar we are specifying background color.
                            TopAppBar(backgroundColor = greenColor,
  
                                // along with that we are specifying title for our top bar.
                                title = {
  
                                    // in the top bar we are specifying tile as a text
                                    Text(
  
                                        // on below line we are specifying
                                        // text to display in top app bar.
                                        text = "Text Extractor in Android",
  
                                        // on below line we are specifying 
                                        // modifier to fill max width.
                                        modifier = Modifier.fillMaxWidth(),
  
                                        // on below line we are 
                                        // specifying text alignment.
                                        textAlign = TextAlign.Center,
  
                                        // on below line we are 
                                        // specifying color for our text.
                                        color = Color.White
                                    )
                                }
                            )
                        }
                    ) {
                        // on below line we are calling text extractor 
                        // method to extract text from pdf.
                        textExtractor()
                    }
                }
            }
        }
    }
}
  
// on below line we are creating a text extractor 
// method to extract text from pdf file.
@Composable
fun textExtractor() {
  
    // on below line we are creating 
    // a variable for extracted text
    val extractedText = remember {
        mutableStateOf("")
    }
  
    // on below line we are creating a column for our ui.
    Column(
        // in this column we are adding a modifier 
        // for our column and specifying 
        // max width, height and size.
        modifier = Modifier
            .fillMaxWidth()
            .fillMaxHeight()
            .fillMaxSize()
  
            // on below line we are adding padding
            // from all sides to our column.
            .padding(6.dp),
  
        // on below line we are adding vertical
        // arrangement for our column as bottom
        verticalArrangement = Arrangement.Bottom,
  
        // on below line we are adding 
        // horizontal alignment for our column.
        horizontalAlignment = Alignment.CenterHorizontally
    ) {
  
        // on below line we are creating a 
        // simple text for displaying our extracted text
        Text(text = extractedText.value, color = Color.Black, fontSize = 12.sp)
  
        // on below line we are adding a 
        // spacer between a text and our button.
        Spacer(modifier = Modifier.height(10.dp))
  
        // on below line we are creating a button.
        Button(
            // on below line we are adding a modifier
            // to it and specifying max width to it.
            modifier = Modifier
                .fillMaxWidth()
  
                // on below line we are adding padding for our button.
                .padding(20.dp),
  
            // on below line we are adding on click for our button.
            onClick = {
  
                // inside on click we are calling extract 
                // data method to extract data from our pdf file.
                extractData(extractedText)
  
            }) {
  
            // on the below line we are displaying a text for our button.
            Text(modifier = Modifier.padding(6.dp), text = "Extract Text from PDF")
        }
    }
  
}
  
// on below line we are creating an extract data method to extract our data.
private fun extractData(extractedString: MutableState<String>) {
    // on below line we are running a try and catch
    // block to handle extract data operation.
    try {
        // on below line we are creating a variable
        // for storing our extracted text
        var extractedText = ""
  
        // on below line we are creating a variable for our pdf extracter.
        val pdfReader: PdfReader = PdfReader("res/raw/android.pdf")
  
        // on below line we are creating 
        // a variable for pages of our pdf.
        val n = pdfReader.numberOfPages
  
        // on below line we are running a for loop.
        for (i in 0 until n) {
  
            // on below line we are appending our data to 
            // extracted text from our pdf file using pdf reader.
            extractedText =
                """
                 $extractedText${
                    PdfTextExtractor.getTextFromPage(pdfReader, i + 1).trim { it <= ' ' }
                }
                  
                 """.trimIndent()
            // to extract the PDF content from the different pages
        }
  
        // on below line we are setting
        // extracted text to our text view.
        extractedString.value = extractedText
  
        // on below line we are 
        // closing our pdf reader.
        pdfReader.close()
  
    }
    // on below line we are handling 
    // our exception using catch block
    catch (e: Exception) {
        e.printStackTrace()
    }
}

Ahora ejecute su aplicación para ver el resultado. 

Producción: 

Publicación traducida automáticamente

Artículo escrito por chaitanyamunje y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *