Présentation des DTD

Décembre 2016

Le rôle de la DTD

XML permet d'utiliser un fichier afin de vérifier qu'un document XML est conforme à une syntaxe donnée. La norme XML définit ainsi une définition de document type appelée DTD (Document Type Definition), c'est-à-dire une grammaire permettant de vérifier la conformité du document XML. La norme XML n'impose pas l'utilisation d'une DTD pour un document XML, mais elle impose par contre le respect exact des règles de base de la norme XML.

Ainsi on parlera de:

  • document valide pour un document XML comportant une DTD
  • document bien formé pour un document XML ne comportant pas de DTD mais répondant aux règles de base du XML

Une DTD peut être définie de 2 façons :

  • sous forme interne, c'est-à-dire en incluant la grammaire au sein même du document
  • sous forme externe, soit en appelant un fichier contenant la grammaire à partir d'un fichier local ou bien en y accédant par son URL

Déclarer un élément

Pour pouvoir créer un document XML il est utile dans un premier temps de définir les éléments pouvant être utilisés, ou plus exactement les informations que l'on désire utiliser.

Ainsi pour définir un élément on utilisera la syntaxe suivante :

<! ELEMENT Nom Modèle >

Le paramètre modèle représente soit un type de donnée prédéfini, soit une règle d'utilisation de l'élément.

Les types prédéfinis utilisables sont les suivants :

Type prédéfini Description
ANY L'élément peut contenir tout type de données
EMPTY L'élément ne contient pas de données spécifiques
#PCDATA L'élément doit contenir une chaîne de caractères

Ainsi un élément nommé Nom contenant un type #PCDATA sera déclaré de la façon suivante dans la DTD :

<! ELEMENT Nom (#PCDATA) >
Nota Le mot clé #PCDATA doit nécessairement être écrit entre parenthèses, au risque sinon d'obtenir une erreur du parseur !

Cet élément pourra être écrit de la façon suivante dans le document XML :

<Nom>Pillou</Nom>

D'autre part il est possible de définir des règles d'utilisation, c'est-à-dire les éléments XML qu'un élément peut ou doit contenir. Cette syntaxe se fait à l'aide de notations spécifiques dont voici un récapitulatif :

Opérateur Signification Exemple
+
L'élément doit être présent au minimum une fois A+
*
L'élément peut être présent plusieurs fois (ou aucune) A*
?
L'élément peut être optionnellement présent A?
|
L'élément A ou l'élément B peuvent être présents A|B
,
L'élément A doit être présent et suivi de l'élément B A,B
()
Les parenthèses permettent de regrouper des éléments afin de leur appliquer les autres opérateurs (A,B)+

Ainsi on peut créer la déclaration suivante dans la DTD :

<!ELEMENT personne (nom,prenom,telephone),email? >

<!ELEMENT nom (#PCDATA) >

<!ELEMENT prenom (#PCDATA) >

<!ELEMENT telephone (#PCDATA) >

<!ELEMENT email (#PCDATA) >
Cette déclaration pourra donc donner un document XML du style :
<personne>

	<nom>Pillou</nom>

	<prenom>Jean-Francois</prenom>

	<telephone>555-123456</telephone>

	<email>webmaster@commentcamarche.net</email>

</personne>
ou bien
<personne>

	<nom>Pillou</nom>

	<prenom>Jeff</prenom>

	<telephone>555-542136</telephone>

</personne>

Déclarer des attributs

Il est possible d'ajouter des propriétés à un élément particulier en lui affectant un attribut, c'est-à-dire une paire clé/valeur. Ainsi avec XML la syntaxe pour définir un attribut est la suivante :

<! ATTLIST Elément Attribut Type >
Type représente le type de donnée de l'attribut, il en existe trois :
  • littéral: il permet d'affecter une chaîne de caractères à un attribut. Pour déclarer un tel type il faut utiliser le mot clé CDATA
  • l'énumération: cela permet de définir une liste de valeurs possibles pour un attribut donné, afin de limiter le choix de l'utilisateur. La syntaxe de ce type d'attribut est :
    <! ATTLIST Elément Attribut (Valeur1 | Valeur2 | ... ) >
    Pour définir une valeur par défaut il suffit de faire suivre l'énumération par la valeur désirée entre guillemets :
    <! ATTLIST Elément Attribut (Valeur1 | Valeur2 ) "valeur par défaut" >
  • atomique: il permet de définir un identifiant unique pour chaque élément grâce au mot clé ID.
Enfin chacun de ces types d'attributs peut être suivi d'un mot clé particulier permettant de spécifier le niveau de nécessité de l'attribut :
  • #IMPLIED signifie que l'attribut est optionnel, c'est-à-dire non obligatoire
  • #REQUIRED signifie que l'attribut est obligatoire
  • #FIXED signifie que l'attribut sera affecté d'une valeur par défaut s'il n'est pas défini. Il doit être immédiatement suivi de la valeur entre guillemets
Ainsi on pourra avoir une déclaration d'attribut du type :
<! ATTLIST disque IDdisk ID #REQUIRED type(K7|MiniDisc|Vinyl|CD)"CD" >

Ce qui signifie que l'on affecte à l'élément disque deux attributs IDdisk et type. Le premier attribut est de type atomique, il s'agit d'un identifiant unique obligatoire. L'élément type peut être soit K7, MiniDisc, Vinyl ou CD, sachant que ce dernier sera affecté par défaut...

Déclarer des notations

XML permet de définir une application par défaut à lancer pour ouvrir des documents non XML encapsulés dans le code XML.

Il est ainsi possible d'associer les images JPG au programme Paint Shop Pro (psp.exe) grâce à la syntaxe suivante :

<! NOTATION jpg SYSTEM "psp.exe">

A voir également :

Ce document intitulé «  Présentation des DTD  » issu de CommentCaMarche (www.commentcamarche.net) est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement.