Analizar XML usando Minidom en Python

DOM (modelo de objeto de documento) es una API multilenguaje de W3C, es decir, World Wide Web Consortium, para acceder y modificar documentos XML . Python le permite analizar archivos XML con la ayuda de xml.dom.minidom , que es la implementación mínima de la interfaz DOM. Es más simple que la API DOM completa y debe considerarse más pequeña.

Los pasos para analizar XML son: 

  • Importar el módulo
import xml.dom.minidom

Digamos que sus archivos XML tendrán las siguientes cosas, 

  • Utilice la función de análisis para cargar y analizar el archivo XML. En el caso siguiente, los documentos almacenan el resultado de la función de análisis
docs = xml.dom.minidom.parse("test.xml")
  • Imprimamos el nombre de etiqueta secundario y el nombre de Node del archivo XML. 

Python3

import xml.dom.minidom
  
docs = xml.dom.minidom.parse("test.xml")
  
print(docs.nodeName)
print(docs.firstChild.tagName)

Producción:

#document
info
  • Ahora, para obtener la información del nombre de la etiqueta, debe llamar a la función estándar dom getElementsByTagName y getAttribute para obtener los atributos requeridos. 

Python3

import xml.dom.minidom
  
  
docs = xml.dom.minidom.parse("test.xml")
  
print(docs.nodeName)
print(docs.firstChild.tagName)
  
skills = docs.getElementsByTagName("skills")
  
print("%d skills" % skills.length)
for i in skills:
    print(i.getAttribute("name"))

Producción:

#document
info
4 skills
Machine learning
Deep learning
Python
Bootstrap

Publicación traducida automáticamente

Artículo escrito por shiv_ka_ansh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *