SlideShare une entreprise Scribd logo
1  sur  18
Télécharger pour lire hors ligne
Unicas & presse locale ancienne
sont dans une interface…
POUR UNE APPLICATION DE VISUALISATION ET D’EXPLORATION DES
DONNÉES.
Le contexte
Point de départ : valorisation de 2 corpus spécifiques de périodiques :
Unicas et presse locale ancienne
Axe « Valorisation des collections » dans notre convention sur objectifs :
- Évaluer nos collections
- améliorer leur visibilité
- Qualité des données et signalement
Moyen :
- Création et mise en ligne d’un outil de visualisation des données du CR basé sur
les web services du Sudoc
Sudoc
Unicas
Presse locale
Avec ISSN
Sans ISSN
Traduction en langage patate
Presse locale
numérisée
Traduction en Excel
 Fichier des unicas Sudoc  Fichier des titres de presse locale BnF
Traduction en langage graphe (my name is Graph, Property Graph)
Node 2
Node 4
Node 1
Node 5
Node 3
Etapes
- On modélise le graphe (quelles sont les ressources – les nœuds – et quelles sont
leurs relations – connues et à construire - ?)
- On fait un chargement initial de données à minima dans la BDD et on automatise
les enrichissements par des requêtes directement dans le graphe
- On développe l’application au-dessus de la BDD
• pour exposer les données (exports Excel et API)
• pour proposer une interface web de visualisation
Pour bien commencer : déterminer les entités que l’on veut étudier = les nœuds
génériques du graphe
Bibliothèques
Titres unicas
Titres presse
loc. anc.
Titres presse
loc. anc.
numérisés
{Nom,rcr,lat,lon}
{titre,ppn,issn,309}
{titre,ark,issn}
{url,étab}
OWNED_BY
{etatd_de_coll}
HAS_VERSION
Départements
{Nom,numéro}
L
O
C
A
T
E
D
IS_ABOUT
S
A
M
E
_
A
S
Petit aparté : la souplesse d’une modélisation de type Property Graph est aussi sa
principale difficulté
On aurait pu faire complètement différemment… d’ailleurs il n’est pas certain du tout que ce soit
meilleure manière de modéliser.
La question essentielle qui doit guider la structuration interne du graphe est : quelles sont les
questions auxquelles je veux pouvoir répondre ?
Unicas
ppn
issnHAS_ID
Presselocale
HAS_ID
ark
Sudoc
BELONGS_TO
BnFBELONGS_TO
MATCH
Petite mise au point : quand on parle de graphe, on pense web de données et
RDF…
Mais il n’y a pas que le RDF dans la vie !
 RDF
 Triplets sujet-prédicat-objet
 S’appuie sur des uri pour identifier les
ressources, et des ontologies pour
qualifier les ressources et les
prédicats
 A pour objectif de modéliser et
formaliser les données et leurs
connexions selon un standard
 Qui permette leur intégration dans le
web (indexation moteurs de
recherche, accès web, navigation,
échange)
 Un stockage en triple store accessible
par un Endpoint
 Un langage de requête SPARQL
 Propriété de graphe (Graph
Property)
 Des nœuds liés par des relations
 Nœuds et liens peuvent être qualifiés
par des propriétés (formalisées
comme des objets clé-valeur), sans
schéma posé à priori.
 Structuration optimisée pour le
stockage et le parcours de graphe (le
requêtage et la navigation dans les
données)
 Des langages de requêtes selon la
bdd choisie (Neo4j, ArangoDB…)
La problématique classique : obtenir les données
- Où sont les données ?
- Comment les extraire ?
Les sources de données
Bibs de l’ILN 230
https://www.idref.fr/services/iln2rcr/230
Ppn des unicas
Self Sudoc
Site BnF presse loc.
anc.
http://presselocaleancienne.bnf.fr/accueil
Peut mieux faire…
Sudoc web service multiwhere
https://www.sudoc.fr/services/multiwher
e/<ppn>
Sudoc web service
UNIMARC/MARCXML
http://www.sudoc.fr/<ppn>.xml
BnF : SRU
http://catalogue.bnf.fr/api/SRU?version=
1.2&operation=searchRetrieve&query=b
ib.persistentid%20adj%20%22<ark>%22
&recordSchema=unimarcxchange
Sudoc web service issn2ppn
http://www.sudoc.fr/services/issn2ppn/<i
ssn>
Interface web
Client Side
(librairies
JS)
Connexion à
la BDD
Graphe
Distribution des données
Server side
(Express) :
API
Données
Json + doc
SWagger
BDD/ETL Neo4j
node
1
node
5
node
2
node
3
node
4
Client side :
Exploitation
API
Tableaux
Widgets
Pour en savoir plus
Liens vers les billets de blogs (passés et à venir)
http://bibliotheque-blogs.unice.fr/sudoc-ps/
http://bibliotheque-blogs.unice.fr/sudoc-ps/tag/valorisation-des-collections/
Code source
Le code de l’application sera disponible en open source dès que l’application sera finalisée (à
la rentrée universitaire 2019).
En attendant :
- https://github.com/gegedenice/angular-sudocps-unicas : pour créer une page web listant
vos unicas (voir par exemple l’adaptation du code par le CR Rhône-Alpes https://bu.univ-
grenoble-alpes.fr/CR69/index.html).
- https://gist.github.com/gegedenice/c7e53cc4c3d65b8bc1639d4b55a90be6 : un gist avec
les requêtes en langage Cypher utilisées pour charger et enrichir les données dans Neo4j.
Nous contacter
Sudocps-scd@unice.fr
geoffroy@unice.fr

Contenu connexe

Similaire à Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques (unicas & presse locale)

Distributed computing with Spark 2.x
Distributed computing with Spark 2.xDistributed computing with Spark 2.x
Distributed computing with Spark 2.xDr Hajji Hicham
 
Concevoir un outil d'analyse de réseau en ligne
Concevoir un outil d'analyse de réseau en ligneConcevoir un outil d'analyse de réseau en ligne
Concevoir un outil d'analyse de réseau en ligneNahid Oulmi
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDAnonue12
 
A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)Abdelkader OUARED
 
Les éléments d'indexation dans la DTD-EAD
Les éléments d'indexation dans la DTD-EADLes éléments d'indexation dans la DTD-EAD
Les éléments d'indexation dans la DTD-EADDanis Habib
 
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech
 
Text mining pour industrie
Text mining pour industrieText mining pour industrie
Text mining pour industrieAli Kabbadj
 
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...Fabien Gandon
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
 
Spark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsSpark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsMICHRAFY MUSTAFA
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked dataVincentBroute
 
web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...Fabien Gandon
 
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBSGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBRomain Cambien
 
JABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
JABES 2016 - DALLOZ et le SCD de l’Université de StrasbourgJABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
JABES 2016 - DALLOZ et le SCD de l’Université de StrasbourgABES
 
Cartographie de l'information
Cartographie de l'informationCartographie de l'information
Cartographie de l'informationlaureno
 
Une introduction au web de données
Une introduction au web de donnéesUne introduction au web de données
Une introduction au web de donnéesYannick Prié
 
cours06-nosql.pdf
cours06-nosql.pdfcours06-nosql.pdf
cours06-nosql.pdfhbadir
 
La caisse à outils de la visualisation d'informations
La caisse à outils de la visualisation d'informationsLa caisse à outils de la visualisation d'informations
La caisse à outils de la visualisation d'informationsChristopheTricot
 
Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de donnéesAbdoulaye Dieng
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueAntidot
 

Similaire à Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques (unicas & presse locale) (20)

Distributed computing with Spark 2.x
Distributed computing with Spark 2.xDistributed computing with Spark 2.x
Distributed computing with Spark 2.x
 
Concevoir un outil d'analyse de réseau en ligne
Concevoir un outil d'analyse de réseau en ligneConcevoir un outil d'analyse de réseau en ligne
Concevoir un outil d'analyse de réseau en ligne
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDA
 
A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)
 
Les éléments d'indexation dans la DTD-EAD
Les éléments d'indexation dans la DTD-EADLes éléments d'indexation dans la DTD-EAD
Les éléments d'indexation dans la DTD-EAD
 
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
 
Text mining pour industrie
Text mining pour industrieText mining pour industrie
Text mining pour industrie
 
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
Spark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsSpark RDD : Transformations & Actions
Spark RDD : Transformations & Actions
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
 
web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...
 
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBSGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
 
JABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
JABES 2016 - DALLOZ et le SCD de l’Université de StrasbourgJABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
JABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
 
Cartographie de l'information
Cartographie de l'informationCartographie de l'information
Cartographie de l'information
 
Une introduction au web de données
Une introduction au web de donnéesUne introduction au web de données
Une introduction au web de données
 
cours06-nosql.pdf
cours06-nosql.pdfcours06-nosql.pdf
cours06-nosql.pdf
 
La caisse à outils de la visualisation d'informations
La caisse à outils de la visualisation d'informationsLa caisse à outils de la visualisation d'informations
La caisse à outils de la visualisation d'informations
 
Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de données
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantique
 

Dernier

Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxPrésentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxJCAC
 
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 37
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneTxaruka
 
PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfRiDaHAziz
 
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 37
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx   Film     françaisPas de vagues.  pptx   Film     français
Pas de vagues. pptx Film françaisTxaruka
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfRiDaHAziz
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre françaisTxaruka
 
Apprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursApprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursStagiaireLearningmat
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 37
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx      Film   françaisPas de vagues.  pptx      Film   français
Pas de vagues. pptx Film françaisTxaruka
 
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxDIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxMartin M Flynn
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfbdp12
 
Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Gabriel Gay-Para
 
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 37
 
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfVulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfSylvianeBachy
 
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24BenotGeorges3
 

Dernier (18)

Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxPrésentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
 
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienne
 
PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdf
 
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx   Film     françaisPas de vagues.  pptx   Film     français
Pas de vagues. pptx Film français
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdf
 
Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre français
 
Apprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursApprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceurs
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx      Film   françaisPas de vagues.  pptx      Film   français
Pas de vagues. pptx Film français
 
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxDIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
 
Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)
 
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
 
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfVulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
 
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
 

Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques (unicas & presse locale)

  • 1. Unicas & presse locale ancienne sont dans une interface… POUR UNE APPLICATION DE VISUALISATION ET D’EXPLORATION DES DONNÉES.
  • 2. Le contexte Point de départ : valorisation de 2 corpus spécifiques de périodiques : Unicas et presse locale ancienne Axe « Valorisation des collections » dans notre convention sur objectifs : - Évaluer nos collections - améliorer leur visibilité - Qualité des données et signalement Moyen : - Création et mise en ligne d’un outil de visualisation des données du CR basé sur les web services du Sudoc
  • 3. Sudoc Unicas Presse locale Avec ISSN Sans ISSN Traduction en langage patate Presse locale numérisée
  • 4. Traduction en Excel  Fichier des unicas Sudoc  Fichier des titres de presse locale BnF
  • 5. Traduction en langage graphe (my name is Graph, Property Graph) Node 2 Node 4 Node 1 Node 5 Node 3 Etapes - On modélise le graphe (quelles sont les ressources – les nœuds – et quelles sont leurs relations – connues et à construire - ?) - On fait un chargement initial de données à minima dans la BDD et on automatise les enrichissements par des requêtes directement dans le graphe - On développe l’application au-dessus de la BDD • pour exposer les données (exports Excel et API) • pour proposer une interface web de visualisation
  • 6. Pour bien commencer : déterminer les entités que l’on veut étudier = les nœuds génériques du graphe Bibliothèques Titres unicas Titres presse loc. anc. Titres presse loc. anc. numérisés {Nom,rcr,lat,lon} {titre,ppn,issn,309} {titre,ark,issn} {url,étab} OWNED_BY {etatd_de_coll} HAS_VERSION Départements {Nom,numéro} L O C A T E D IS_ABOUT S A M E _ A S
  • 7. Petit aparté : la souplesse d’une modélisation de type Property Graph est aussi sa principale difficulté On aurait pu faire complètement différemment… d’ailleurs il n’est pas certain du tout que ce soit meilleure manière de modéliser. La question essentielle qui doit guider la structuration interne du graphe est : quelles sont les questions auxquelles je veux pouvoir répondre ? Unicas ppn issnHAS_ID Presselocale HAS_ID ark Sudoc BELONGS_TO BnFBELONGS_TO MATCH
  • 8. Petite mise au point : quand on parle de graphe, on pense web de données et RDF… Mais il n’y a pas que le RDF dans la vie !  RDF  Triplets sujet-prédicat-objet  S’appuie sur des uri pour identifier les ressources, et des ontologies pour qualifier les ressources et les prédicats  A pour objectif de modéliser et formaliser les données et leurs connexions selon un standard  Qui permette leur intégration dans le web (indexation moteurs de recherche, accès web, navigation, échange)  Un stockage en triple store accessible par un Endpoint  Un langage de requête SPARQL  Propriété de graphe (Graph Property)  Des nœuds liés par des relations  Nœuds et liens peuvent être qualifiés par des propriétés (formalisées comme des objets clé-valeur), sans schéma posé à priori.  Structuration optimisée pour le stockage et le parcours de graphe (le requêtage et la navigation dans les données)  Des langages de requêtes selon la bdd choisie (Neo4j, ArangoDB…)
  • 9. La problématique classique : obtenir les données - Où sont les données ? - Comment les extraire ?
  • 10. Les sources de données Bibs de l’ILN 230 https://www.idref.fr/services/iln2rcr/230 Ppn des unicas Self Sudoc Site BnF presse loc. anc. http://presselocaleancienne.bnf.fr/accueil
  • 11. Peut mieux faire… Sudoc web service multiwhere https://www.sudoc.fr/services/multiwher e/<ppn> Sudoc web service UNIMARC/MARCXML http://www.sudoc.fr/<ppn>.xml BnF : SRU http://catalogue.bnf.fr/api/SRU?version= 1.2&operation=searchRetrieve&query=b ib.persistentid%20adj%20%22<ark>%22 &recordSchema=unimarcxchange Sudoc web service issn2ppn http://www.sudoc.fr/services/issn2ppn/<i ssn>
  • 12. Interface web Client Side (librairies JS) Connexion à la BDD Graphe Distribution des données Server side (Express) : API Données Json + doc SWagger BDD/ETL Neo4j node 1 node 5 node 2 node 3 node 4 Client side : Exploitation API Tableaux Widgets
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18. Pour en savoir plus Liens vers les billets de blogs (passés et à venir) http://bibliotheque-blogs.unice.fr/sudoc-ps/ http://bibliotheque-blogs.unice.fr/sudoc-ps/tag/valorisation-des-collections/ Code source Le code de l’application sera disponible en open source dès que l’application sera finalisée (à la rentrée universitaire 2019). En attendant : - https://github.com/gegedenice/angular-sudocps-unicas : pour créer une page web listant vos unicas (voir par exemple l’adaptation du code par le CR Rhône-Alpes https://bu.univ- grenoble-alpes.fr/CR69/index.html). - https://gist.github.com/gegedenice/c7e53cc4c3d65b8bc1639d4b55a90be6 : un gist avec les requêtes en langage Cypher utilisées pour charger et enrichir les données dans Neo4j. Nous contacter Sudocps-scd@unice.fr geoffroy@unice.fr