TEF 2.0

L'inventaire des fichiers (mets:fileSec)

Cette section sert à lister des groupes de fichiers, chacun de ces groupes correspondant à une édition de la thèse. Chaque groupe de premier niveau comprend tous les fichiers qui constituent une édition.

Seule l'édition d'archivage doit obligatoirement être représentée dans cette section. Cette présence est facultative pour les autres éditions.

<mets:fileSec>
 <mets:fileGrp ID="FGrID1" USE="archive_et_diffusion">
  <mets:file ID="FID2" ADMID="file_ed1_pdf">
   <mets:FLocat LOCTYPE="URL" xlink:href="these\pdf\body\these.pdf"/>
  </mets:file>
 </mets:fileGrp>
</mets:fileSec>

Dans cet exemple, on retrouve un groupe de fichiers (mets:fileGrp) ayant pour identifiant "FGrID1". C'est celui-là même qui était associé, dans la carte de structure, à une des éditions :

...
<mets:div TYPE="EDITION" DMDID="desc_ed1">
 <mets:fptr FILEID="FGrID1"/>
</mets:div>
...

Cet élément mets:fileGrp peut contenir soit les fichiers individuels ( mets:file ), soit d'autres groupes de fichiers qui contiennent eux-mêmes des fichiers ou des groupes de fichiers. Seul un mets:fileGrp de premier niveau correspond à une édition.

Même si la section mets:fileSec peut ne concerner que l'édition d'archivage, elle peut aussi représenter les autres éditions, destinées à la diffusion. Comment distinguer ces deux types d'éditions ? C'est l'attribut USE qui opère cette distinction. Le groupe de fichiers qui correspond à une édition d'archivage possède l'un de ces deux attributs :

 USE="archive"

 USE="archive_et_diffusion"

Cette deuxième valeur de l'attribut USE permet de qualifier une édition destinée à la fois à l'archivage et à la diffusion, comme une édition PDF peut l'être.

Chaque fichier ( mets:file ) possède un attribut ADMID qui renvoie à un bloc de métadonnées de conservation.

Au niveau mets:file , l'attribut USE indique s'il s'agit ou non du fichier maître (USE="maitre"). Le fichier maître est le fichier qu'il faut ouvrir en premier pour accéder à l'ensemble d'un document. Une édition HTML a pour fichier maître un fichier HTML, qui par convention se nomme souvent "index.html". Si une édition PDF est en plusieurs fichiers, il faut aussi préciser quel en est le fichier maître.

<mets:fileSec>
 <mets:fileGrp ID="FGrID1" USE="diffusion">
  <mets:file ID="FID9" ADMID="fil9_html" USE="maitre">
   <mets:FLocat LOCTYPE="URL" xlink:href="these\html\body\index.html"/>
  </mets:file>
 </mets:fileGrp>
</mets:fileSec>

Pour faire le lien entre la description d'un fichier et le fichier lui-même, mets:file a pour enfant l'élément mets:FLocat qui permet de donner l'adresse physique du fichier. Il peut s'agir d'une URL ou d'un chemin vers un répertoire local, comme dans cet exemple :

<mets:FLocat LOCTYPE="URL" xlink:href="these\pdf\body\these.pdf"/>

Chaque fichier (mets:file) peut posséder un attribut ID, qui lui associe un identifiant unique. Cet identifiant permet d'établir un lien entre une ressource externe et un fichier. Lorsqu'une ressource externe, par exemple une image ou un graphique, est isolée dans un fichier à part, la gestion du document peut en être facilitée. Par exemple, il devient possible d'extraire automatiquement cette ressource externe pour générer une version incomplète de la thèse, amputée de ses parties obéissant par exemple à un régime juridique différent.

...
<mets:fileSec>
 <mets:fileGrp USE="archive" ID="FGrID1">
  <mets:file ID="FID2" ADMID="file_ed1_xml_1">
   <mets:FLocat LOCTYPE="URL" xlink:href="these\xml\body\these.xml"/>
  </mets:file>
  <mets:file ID="FID3" ADMID="file_ed1_jpg_2">
   <mets:FLocat LOCTYPE="URL" xlink:href="these\xml\images\these.jpg"/>
  </mets:file>
 </mets:fileGrp>
</mets:fileSec>
...
<mets:structMap TYPE="logical">
 <mets:div TYPE="THESE">
  <mets:div TYPE="RESSOURCE_TIERS" ...>
   <mets:fptr FILEID="FID3"/>
  </mets:div>
 </mets:div>
</mets:structMap>
...

Cette possibilité n'est pas généralisable à toutes les thèses. Par exemple, elle n'est pas disponible dans le cas des éditions PDF où tout est compris dans un seul fichier ou dans le cas des ressources externes textuelles, rarement séparées du reste du texte de la thèse. Quand un tel lien est impossible, la ressource externe est seulement mentionnée dans la carte de structure, associée à ses métadonnées, mais elle n'est pas reliée à un fichier ou un groupe de fichiers.

...
  <mets:div TYPE="RESSOURCE_TIERS" DMDID="xerft" ADMID="rdt5yj"/>
...