Requisito previo: trabajar con el módulo .docx
Los documentos de Word contienen texto con formato envuelto en tres niveles de objeto. Los objetos de ejecución de nivel más bajo, los objetos de párrafo de nivel medio y los objetos de documento de nivel más alto. Por lo tanto, no podemos trabajar con estos documentos usando editores de texto normales. Pero podemos manipular estos documentos de Word en python usando el módulo python-docx. El comando Pip para instalar este módulo es:
pip install python-docx
El módulo Python docx permite a los usuarios manipular documentos ya sea manipulando el existente o creando un nuevo documento vacío y manipulándolo. Es una herramienta poderosa ya que te ayuda a manipular el documento en gran medida.
Ahora, para usar el módulo python-docx, debe importarlo como docx.
# Import docx NOT python-docx import docx
Luego, para crear una instancia del documento de Word. Usaremos el método Document() del módulo docx.
Sintaxis: docx.Document ( ruta de la string )
Parámetro:
- String path: Es un parámetro opcional. Especifica la ruta del archivo a abrir. Si se deja vacío, se crea un nuevo archivo de documento vacío.
Y para guardar el documento usaremos el método save() del módulo docx.
Sintaxis: doc.save( String path_to_document )
Parámetro:
- String path_to_document: Es el nombre del archivo por el cual se guardará el documento. Incluso puedes poner la ruta donde quieras guardarlo.
Ejemplo 1: Abriendo un nuevo documento.
Python3
# Import docx NOT python-docx import docx # Create an instance of a word document doc = docx.Document() # Now save the document to a location doc.save('gfg.docx')
Producción:
Ejemplo 2: Abrir un documento creado previamente y volver a guardarlo con un nombre diferente.
Python3
# Import docx NOT python-docx import docx # Opening a previously created document doc = docx.Document('gfg.docx') # Now save the document to a location doc.save('gfg-copy.docx')
Producción:
Publicación traducida automáticamente
Artículo escrito por aditya_taparia y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA