DOM (modelo de objeto de documento) es una API multilenguaje de W3C, es decir, World Wide Web Consortium, para acceder y modificar documentos XML . Python le permite analizar archivos XML con la ayuda de xml.dom.minidom , que es la implementación mínima de la interfaz DOM. Es más simple que la API DOM completa y debe considerarse más pequeña.
Los pasos para analizar XML son:
- Importar el módulo
import xml.dom.minidom
Digamos que sus archivos XML tendrán las siguientes cosas,
- Utilice la función de análisis para cargar y analizar el archivo XML. En el caso siguiente, los documentos almacenan el resultado de la función de análisis
docs = xml.dom.minidom.parse("test.xml")
- Imprimamos el nombre de etiqueta secundario y el nombre de Node del archivo XML.
Python3
import xml.dom.minidom docs = xml.dom.minidom.parse("test.xml") print(docs.nodeName) print(docs.firstChild.tagName)
Producción:
#document info
- Ahora, para obtener la información del nombre de la etiqueta, debe llamar a la función estándar dom getElementsByTagName y getAttribute para obtener los atributos requeridos.
Python3
import xml.dom.minidom docs = xml.dom.minidom.parse("test.xml") print(docs.nodeName) print(docs.firstChild.tagName) skills = docs.getElementsByTagName("skills") print("%d skills" % skills.length) for i in skills: print(i.getAttribute("name"))
Producción:
#document info 4 skills Machine learning Deep learning Python Bootstrap
Publicación traducida automáticamente
Artículo escrito por shiv_ka_ansh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA