Veamos cómo leer un PDF que está convirtiendo un archivo PDF de texto en audio.
Paquetes utilizados:
- pyttsx3: es una biblioteca de Python para Text to Speech. Tiene muchas funciones que ayudarán a la máquina a comunicarse con nosotros. Ayudará a la máquina a hablarnos.
- PyPDF2: Ayudará al texto del PDF. Una biblioteca Pure-Python construida como un kit de herramientas PDF. Es capaz de extraer información de documentos, dividir documentos página por página, fusionar documentos página por página, etc.
Ambos módulos necesitan ser instalados
pip install pyttsx3 pip install PyPDF2
También necesita conocer la función open() que nos ayudará a abrir el PDF en modo de lectura. También se recomienda el conocimiento del Concepto OOPS.
Aquí está el enlace del PDF que se lee en el ejemplo: https://drive.google.com/file/d/1zhf7-_v6CVUtgd_XMK562mg6ciewi1QR/view?usp=sharing
Acercarse:
- Importe los módulos PyPDF2 y pyttx3.
- Abra el archivo PDF.
- Utilice PdfFileReader() para leer el PDF. Solo tenemos que dar la ruta del PDF como argumento.
- Utilice el método getPage() para seleccionar la página que se va a leer.
- Extrae el texto de la página usando extractText() .
- Crea una instancia de un objeto pyttx3.
- Utilice los métodos say() y runwait() para pronunciar el texto.
Ahora aquí el código para ello
Python3
# importing the modules import PyPDF2 import pyttsx3 # path of the PDF file path = open('file.pdf', 'rb') # creating a PdfFileReader object pdfReader = PyPDF2.PdfFileReader(path) # the page with which you want to start # this will read the page of 25th page. from_page = pdfReader.getPage(24) # extracting the text from the PDF text = from_page.extractText() # reading the text speak = pyttsx3.init() speak.say(text) speak.runAndWait()
Producción:
Publicación traducida automáticamente
Artículo escrito por abhisheksrivastaviot18 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA