Dans le premier chapitre, une distinction a été introduite entre quatre types de métadonnées :
métadonnées descriptives (bibliographiques)
métadonnées administratives
métadonnées de droits
métadonnées de conservation
Dans le chapitre 2, une autre distinction a été introduite pour expliciter les différentes entités confusément mêlées dans la notion de thèse :
la thèse en tant qu'oeuvre
les versions
les éditions
les fichiers
les ressources externes
Si on croise ces deux distinctions, on obtient un tableau à deux entrées. Chaque cellule correspond à un ensemble de métadonnées, caractérisées par leur fonction et par la nature de l'entité à laquelle elles se rapportent.
| thèse | version | édition | fichier | ressource externe | ||||||
|
|
|
|
|
||||||
|
|
|||||||||
|
|
|
|
|||||||
|
|
|
Concevoir un format XML pour les métadonnées de thèse électronique revient à traduire ce tableau en une structure XML. Cette structure doit bien identifier chacun de ces blocs de métadonnées tout en le rattachant à l'entité qui convient, ce que montre le schéma qui suit.

Figure 4. Les entités TEF et leurs métadonnées
METS ( Metadata Encoding and Transmission Standard ) est un standard maintenu par la Bibliothèque du Congrès. C'est un vocabulaire XML qui permet d'organiser des métadonnées variées se rapportant à un objet numérique complexe (revues numériques, sites Web...).
Dans la perspective de TEF, METS présente quatre caractéristiques particulièrement intéressantes :
la carte de structure ( mets:structMap ) qui permet d'inventorier les différentes composantes logiques ou physiques d'un objet numérique complexe
la section des fichiers ( mets:fileSec ) qui permet d'inventorier les fichiers et de consigner leur mode d'organisation physique
le fait que METS ne prescrive aucun langage de métadonnées particulier. C'est une enveloppe vide dans laquelle tout type de métadonnées peut être utilisé.
l'organisation modulaire des métadonnées : à chaque type de métadonnées correspond un bloc XML particulier.
C'est pourquoi la structure XML de TEF repose sur METS.
TEF et METS
Toute notice TEF est un document METS valide. L'inverse n'est pas vrai. Si un document METS ne respecte pas les contraintes propres à TEF, alors il ne s'agit pas d'une notice TEF. La recommandation livre des outils XML qui permettent de vérifier automatiquement la conformité à TEF (cf. Section 13).
TEF n'utilise pas toutes les possibilités offertes par METS. Pour autant, la plupart de ces fonctionnalités non exploitées restent utilisables dans le cadre de TEF, même si la recommandation n'en fait pas état. Ainsi, un document METS peut contenir une section mets:structLink, très utile par ailleurs pour traiter des sites Web. Dans le cadre de TEF, cette section n'est pas prévue, mais elle n'est pas interdite.
Cela signifie qu'une notice TEF peut contenir des sections, des éléments ou des attributs METS qui ne sont jamais envisagés par cette recommandation. Cette possibilité permet d'étendre TEF et de l'adapter à des besoins particuliers. Si ces extensions à TEF sont tolérées par les outils de validation XML fournis avec la recommandation, elles demeurent extérieures à TEF au sens où un système compatible TEF n'est pas censé les interpréter. Il peut se contenter de les ignorer.
Voici le squelette général de la structure METS appliquée à TEF :
Racine METS ( mets:mets )
En-tête METS ( mets:metsHdr )
Blocs de métadonnées descriptives ( mets:dmdSec )
Blocs de métadonnées de gestion ( mets:techMD ou mets:rightsMD )
Inventaire des fichiers ( mets:fileSec )
Arbre des entités TEF ( mets:structMap )

Figure 5. Notice TEF -- les liens entre les entités TEF et les blocs de métadonnées (zoom)
La suite de ce chapitre contient une présentation générale de chacune de ces composantes.