DTD - Blocchi di costruzione XML
Gli elementi costitutivi principali dei documenti XML e HTML sono gli elementi.
Gli elementi costitutivi dei documenti XML
Visti da un punto di vista DTD, tutti i documenti XML sono costituiti dai seguenti elementi costitutivi:
- Elementi
- Attributi
- Entità
- PCDATA
- CDATA
Elementi
Gli elementi sono gli elementi costitutivi principali dei documenti XML e HTML.
Esempi di elementi HTML sono "body" e "table". Esempi di elementi XML potrebbero essere "note" e "message". Gli elementi possono contenere testo, altri elementi o essere vuoti. Esempi di elementi HTML vuoti sono "hr", "br" e "img".
Esempi:
<body>some text</body>
<message>some text</message>
Attributi
Gli attributi forniscono informazioni aggiuntive sugli elementi .
Gli attributi sono sempre inseriti all'interno del tag di apertura di un elemento. Gli attributi sono sempre disponibili in coppie nome/valore. Il seguente elemento "img" contiene informazioni aggiuntive su un file sorgente:
<img src="computer.gif" />
Il nome dell'elemento è "img". Il nome dell'attributo è "src". Il valore dell'attributo è "computer.gif". Poiché l'elemento stesso è vuoto, viene chiuso da un " /".
Entità
Alcuni caratteri hanno un significato speciale in XML, come il segno minore di (<) che definisce l'inizio di un tag XML.
La maggior parte di voi conosce l'entità HTML: " ". Questa entità "no-breaking-space" viene utilizzata in HTML per inserire uno spazio aggiuntivo in un documento. Le entità vengono espanse quando un documento viene analizzato da un parser XML.
Le seguenti entità sono predefinite in XML:
Entity References | Character |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA significa dati di caratteri analizzati.
Pensa ai dati dei caratteri come al testo che si trova tra il tag di inizio e il tag di fine di un elemento XML.
PCDATA è testo che SARÀ analizzato da un parser . Il testo verrà esaminato dal parser per entità e markup .
I tag all'interno del testo verranno trattati come markup e le entità verranno espanse.
Tuttavia, i dati dei caratteri analizzati non devono contenere caratteri &, < o >; questi devono essere rappresentati dal & < e > entità, rispettivamente.
CDATA
CDATA significa dati del carattere.
CDATA è un testo che NON verrà analizzato da un parser . I tag all'interno del testo NON verranno trattati come markup e le entità non verranno espanse.