Jeux de données réutilisables

Les jeux de données réutilisables sont décrits selon les critères suivants : 

  • périmètre des données concernées
  • formats disponibles
  • modalités de récupération
  • conditions juridiques 
  • cadre de réutilisation.

  • Notices bibliographiques Sudoc - format MARC

    Périmètre

    Notices bibliographiques Sudoc.

    Lire la suite
  • Notices bibliographiques Sudoc - format RDF

    Périmètre

    En cohérence avec la politique d'exposition des données du Sudoc sur le Web de données ,  il est possible de récupérer les notices bibliographiques Sudoc au format RDF.

    Précision :  toutes les zones et sous-zones UNIMARC ne sont pas converties en RDF. En effet, certaines zones et sous-zones proviennent de sources externes, certains fournisseurs n’autorisant pas l’exposition de leurs données, comme par exemple l’identifiant ISSN (zone 011) et du titre-clé (zone 530), qui font l’objet d’une validation par le CIEPS. Par ailleurs, certaines zones ne sont pas exposées du fait de la complexité de leur modélisation ou de la différence de granularité avec UNIMARC (ex : zone du titre et de la mention de responsabilité - zone 200 - concaténée en dc:title).

    Important : les données RDF sont à jour puisqu'elles sont converties "à la volée" depuis une base d’export en UNIMARC, miroir de la base de production.

    Lire la suite
  • Notices d’autorité Sudoc (IdRef) - format MARC

    Périmètre

    Les notices d’autorité Sudoc accessibles via IdRef sont ouvertes à la réutilisation.

    • Notices d'autorité Sudoc accessibles via IdRef : Auteurs/titres / Collectivités / Congrès / Noms géographiques ou de territoire / Noms de marque / Noms de personnes / Noms de famille / Titres uniformes / Noms communs Rameau / FMeSH

    Précision : les notices RCR (centres de ressources) font l’objet d’une rubrique spécifique .

    Lire la suite
  • Notices d’autorité Sudoc (IdRef) - Dublin Core

    Périmètre

    Il s'agit des notices d’autorité du catalogue Sudoc accessibles via l’interface d’IdRef :  Collectivités / Congrès, Noms communs Rameau, Noms géographiques ou de territoire, Noms de marque, Noms de personnes, Auteurs/titres, Titres uniformes, FMeSH, Noms de famille

    Les notices de Centres de Ressources (RCR) font l’objet d’une rubrique spécifique.

    Lire la suite
  • Notices d’autorité Sudoc (IdRef) - format RDF

    Périmètre

    Les notices d’autorité accessibles via IdRef sont réutilisables. Les données d'autorité en RDF agglomèrent les informations contenues dans chaque notice d'autorité ainsi que les notices descriptives des documents auxquels elle est associée (en tant qu'auteur, illustrateur, sujet…). Il s'agit donc d'une concaténation des données d’autorité et des données bibliographiques Sudoc.

    Lire la suite
  • Notices RCR - format XML

    Périmètre

    Les notices RCR décrivent les centres de ressources et bibliothèques membres des réseaux Sudoc et Sudoc-PS. Il s'agit d'un type spécifique de notices d’autorité accessibles via Sudoc et IdRef.

    Lire la suite
  • Données accessibles par theses.fr

    Périmétre

    Les données disponibles via theses.fr sont produites à partir des applications nationales Step  (thèses en préparation), Star et Sudoc (thèses soutenues).

    Lire la suite
  • Données produites dans Star

    Périmétre

    L'application nationale Star gère les différentes étapes du signalement des thèses de doctorat au format électronique soutenues dans les établissements français habilités à délivrer le doctorat.

    Lire la suite
  • Données Calames - format EAD

    Périmétre

    Les données produites dans Calames sont structurées au format EAD, ce qui les rend difficilement récupérable vu la richesse de la description hiérarchisée et la contextualisation de chaque ensemble documentaire,.

    De ce fait, seuls les niveaux descriptifs de haut et  bas niveaux des fichiers EAD publiés dans Calames sont exposés. Sont récupérables :

    • données des documents ayant fait l’objet d’une publication dans Calames
    • commentaires XML 
    • éléments comportant l’attribut @audience="internal" selon le format choisi

    Précision : les en-têtes des fichiers EAD - élément <eadheader> -  ne sont jamais récupérables.

    Lire la suite
  • Données Bacon : au format KBART

    Périmétre

    La Base de Connaissances Nationale BACON fournit aux établissements les listes de titres de ressources électroniques (périodiques et e-books) au format standard KBART . Ces fichiers sont librement récupérables et réutilisables.

    Lire la suite
Remonter