Approfondimenti su XML
1. XML è un metodo per collocare dati strutturati in un file di testo
"piatto"
Dati
strutturati sono quelli che possono essere organizzati in campi (per
esempio una rubrica, una tabella, una base di dati, una rete semantica
o mappa concettuale, una base di conoscenza o una base di dati).
Spesso questi dati vengono gestiti in modo binario, non gestibile dalla
persona, essendo necessario il programma originante (o uno simile per la
decodifica) per poter accedere ai contenuti. XML è un formato testuale
e "marcato", ovvero, può
essere "letto" e controllato da una persona, anche se non è il
suo obiettivo,. XML è costituito da un insieme
di regole, direttive, convenzioni che consentono progettare formati testuali
per questi dati, in modo da produrre file che sono facili da generare e
leggere (dal computer), inequivocabili, senza limitazioni,
come la mancanza di estensibilità, o di internazionalizzazione.
2. XML assomiglia un po' a HTML ma non è HTML
Come
HTML, XML utilizza marche (tags) (parole delimitate da '<' e
'>') e attributi (della forma nome="valore" ),
ma mentre HTML specifica cosa significa ogni marca e attributo (e spesso
l'apparenza del testo nel browser ), XML utilizza le marche per
delimitare elementi di dati, e lascia totalmente l'interpretazione dei
dati all'applicazione che li legge. In altre parole, se vediamo
"<p>" in un file XML, non è necessario assumere che si
tratta di un paragrafo. In dipendenza del contesto, può essere un
prezzo, una persona, e forse non ha a che fare con una parola che inizi
con "p".
3. XML è un testo, ma non è progettato per la "lettura"
I file XML
sono file di testo, ma ancora meno che HTML sono destinati alla lettura
da parte delle persone. Sono file di testo, perché permettono agli esperti (ad
esempio i programmatori e i "lavoratori della conoscenza"), di controllare le applicazioni, e in un'emergenza
usare un editor di testi per riparare un errore. Ma le regole per i
file XML sono più rigorose che per HTML. Una marca dimenticata o
semplicemente una virgoletta (") sbagliata rendono inutilizzabile il file.
Al contrario di quanto accade con i file HTML, quando un'applicazione
trova un errore in un file XML, emette un messaggio di errore e ferma
la "lettura" o l'importazione.
4.
XML è una famiglia di tecnologie
Esiste
XML
1.0, la specifica che definisce cosa e come sono
marche (tags) e attributi, ma intorno a XML 1.0 c'è anche un
insieme di moduli opzionali che offrono marche e attributi o
direttive per attività specifiche. Esistono anche
Xlink,
XPointer e
XFragments;
CSS,
il linguaggio di fogli di stile, è applicabile anche a XML come lo è a
HTML.
XSL è il linguaggio avanzato per i fogli di
stile.
RDF
(Resource
Definition Framework), lo standard per i metadati del
WWW, offre una grammatica e sintassi per rendere comune la descrizione
delle risorse per agevolare l'interoperabilità fra applicazioni.
Ci sono tanti altri sviluppi, ma
risulta specialmente interessante il derivato
XTM
("topic
maps" o meglio "mappe di contenuti",
vedere),
orientato specialmente alla descrizione e interscambio di informazione
associativa (quali mappe concettuali, reti semantiche, ecc).
Questo è il formato
specifico per l'interscambio dei contenuti tra applicazioni che
gestiscono conoscenza o organizzazioni analoghe.
5. XML è verboso, ma questo non è "un problema"
Essendo
XML un formato testuale che utilizza marche per delimitare i dati, i
file XML tendono di norma ad essere grandi. Allo stesso tempo anche i dischi
hanno questa tendenza,
esistono comunque programmi per comprimere questi file. Anche i modem
sono attrezzati per la compressione on-line, come anche i protocolli per la trasmissione di dati nel web.
|