Regole di sintassi XML
Le regole di sintassi di XML sono molto semplici e logiche. Le regole sono facili da imparare e facili da usare.
I documenti XML devono avere un elemento radice
I documenti XML devono contenere un elemento radice che è il padre di tutti gli altri elementi:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
In questo esempio <note> è l'elemento radice:
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
Il prologo XML
Questa riga è chiamata prologo XML :
<?xml version="1.0" encoding="UTF-8"?>
Il prologo XML è facoltativo. Se esiste, deve essere presente per primo nel documento.
I documenti XML possono contenere caratteri internazionali, come il norvegese øæå o il francese êèé.
Per evitare errori, è necessario specificare la codifica utilizzata o salvare i file XML come UTF-8.
UTF-8 è la codifica dei caratteri predefinita per i documenti XML.
La codifica dei caratteri può essere studiata nel nostro Tutorial sui set di caratteri .
UTF-8 è anche la codifica predefinita per HTML5, CSS, JavaScript, PHP e SQL.
Tutti gli elementi XML devono avere un tag di chiusura
In XML, è illegale omettere il tag di chiusura. Tutti gli elementi devono avere un tag di chiusura:
<p>This is a paragraph.</p>
<br />
Nota: il prologo XML non ha un tag di chiusura! Questo non è un errore. Il prologo non fa parte del documento XML.
I tag XML fanno distinzione tra maiuscole e minuscole
I tag XML fanno distinzione tra maiuscole e minuscole. Il tag <Lettera> è diverso dal tag <lettera>.
I tag di apertura e chiusura devono essere scritti con lo stesso caso:
<message>This is correct</message>
Le "Variabili di apertura e chiusura" vengono spesso definite "Variabili di inizio e fine". Usa quello che preferisci. È esattamente la stessa cosa.
Gli elementi XML devono essere nidificati correttamente
In HTML, potresti vedere elementi nidificati in modo errato:
<b><i>This text is bold and italic</b></i>
In XML, tutti gli elementi devono essere correttamente annidati l'uno nell'altro:
<b><i>This text is bold and italic</i></b>
Nell'esempio sopra, "nidificato correttamente" significa semplicemente che poiché l'elemento <i> è aperto all'interno dell'elemento <b>, deve essere chiuso all'interno dell'elemento <b>.
I valori degli attributi XML devono essere sempre citati
Gli elementi XML possono avere attributi nelle coppie nome/valore proprio come in HTML.
In XML, i valori degli attributi devono essere sempre citati:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
Riferimenti di entità
Alcuni caratteri hanno un significato speciale in XML.
Se inserisci un carattere come "<" all'interno di un elemento XML, verrà generato un errore perché il parser lo interpreta come l'inizio di un nuovo elemento.
Questo genererà un errore XML:
<message>salary < 1000</message>
Per evitare questo errore, sostituisci il carattere "<" con un riferimento a un'entità :
<message>salary < 1000</message>
Ci sono 5 riferimenti di entità predefiniti in XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Solo < e & sono rigorosamente illegali in XML, ma è buona abitudine sostituire > con > anche.
Commenti in XML
La sintassi per scrivere commenti in XML è simile a quella di HTML:
<!-- This is a comment -->
Non sono consentiti due trattini nel mezzo di un commento:
<!-- This is an invalid -- comment -->
Gli spazi bianchi sono conservati in XML
XML non tronca più spazi bianchi (HTML tronca più spazi bianchi in un singolo spazio bianco):
XML: | Hello Tove |
HTML: | Hello Tove |
XML memorizza la nuova riga come LF
Le applicazioni Windows memorizzano una nuova riga come: ritorno a capo e avanzamento riga (CR+LF).
Unix e Mac OSX usano LF.
I vecchi sistemi Mac usano CR.
XML memorizza una nuova riga come LF.
XML ben formato
I documenti XML conformi alle regole di sintassi di cui sopra sono detti documenti XML "ben formati".