Un documento XML (lenguaje de marcado extensible) contiene declaraciones, elementos, texto y atributos. Está formado por entidades (unidades de almacenamiento) y nos dice la estructura de los datos a los que se refiere. Se utiliza para proporcionar un formato estándar de transmisión de datos. Como ayuda en la entrega de mensajes, no siempre se almacena físicamente, es decir, en un disco, sino que se genera dinámicamente pero su estructura siempre permanece igual.
Estructura estándar XML y sus reglas:
Regla 1: Su formato estándar consiste en un prólogo XML que contiene tanto la Declaración XML como la DTD (Definición de tipo de documento) XML y el cuerpo. Si el prólogo XML está presente, siempre debe ser el comienzo del documento. La versión XML, de forma predeterminada, es 1.0 e incluir solo esto forma la declaración XML más corta. UTF-8 es la codificación de caracteres predeterminada y es uno de los siete esquemas de codificación de caracteres. Si no está presente, puede dar lugar a algunos errores de codificación.
Sintaxis de la declaración XML:
<?xml version="1.0" encoding="UTF-8"?>
Sintaxis de DTD:
<!DOCTYPE root-element [<!element-declarations>]>
Ejemplo:
XML
<!DOCTYPE website [ <!ELEMENT website (name,company,phone)> <!ELEMENT name (#PCDATA)> <!ELEMENT company (#PCDATA)> <!ELEMENT phone (#PCDATA)> ]> <website> <name>GeeksforGeeks</name> <company>GeeksforGeeks</company> <phone>011-24567981</phone> </website>
Regla 2: los documentos XML deben tener un elemento raíz (el elemento padre supremo) y sus elementos secundarios (subelementos). Para tener una mejor vista de la jerarquía de los elementos de datos, XML sigue la estructura de árbol XML que se compone de una sola raíz (principal) y varias hojas (secundarias).
Código fuente del diagrama anterior:
XML
<?xml version="1.0" encoding="UTF-8"?> <website> <company category="geeksforgeeks"> <title>Machine learning</title> <author>aarti majumdar</author> <year>2022</year> </company> <company category="geeksforgeeks"> <title>Web Development</title> <author>aarti majumdar</author> <year>2022</year> </company> <company category="geeksforgeekse"> <title>XML</title> <author>aarti majumdar</author> <year>2022</year> </company> </website>
Regla 3: todos los elementos XML deben tener etiquetas de cierre y apertura (similares a HTML).
XML
<message>Welcome to GeeksforGeeks</message>
Regla 4: Las etiquetas de apertura y cierre distinguen entre mayúsculas y minúsculas. Por ejemplo, <Mensaje> es diferente del <mensaje> del ejemplo anterior.
Regla 5: Los valores de los atributos XML deben tener citas:
XML
<website category="open source"> <company>geeksforgeeks</company> </website>
Regla 6: Los espacios en blanco se conservan y mantienen en XML.
XML
<message>welcome to geeksforgeeks</message>
Regla 7: Los comentarios se pueden definir en XML encerrados entre las etiquetas <!– y –>.
XML
<!-- XML Comments are defined like this -->
Regla 8: los elementos XML deben anidarse correctamente.
XML
<message> <company>GeeksforGeeks</company> </message>