Publicatie:Tijdschriften in the picture. Matching van datasets en dataverrijking van tijdschriftrecords

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen


Samenvatting

Voor dit onderzoek werden gepubliceerde opendatasets van tijdschriften die door diverse bibliotheken in binnen- en buitenland aangeboden worden onder de loep genomen. Via deze datasets wordt het mogelijk om geautomatiseerd je eigen data te verrijken. KADOC wil op basis van beschikbare (open) datasets bijvoorbeeld geautomatiseerd de eigen bibliotheekcatalogus aanvullen met o.a. persistente links naar beschikbare digitale exemplaren van een tijdschrift elders. Maar is het technisch haalbaar om dit te doen? Bestaat er iets als een kwaliteitscontrole op de data die binnengehaald wordt? Zijn open datasets ook echt “open”? Op basis van eigen onderzoek, gesprekken met experten en een korte praktijktest proberen we een antwoord te bieden op deze vragen.

Het onderzoek maakt deel uit van het project "Tijdschriften in the picture" dat werd gesubsidieerd door de Vlaamse Overheid en EFRO REACT EU (2022-2023).


Referentie
Titel Tijdschriften in the picture. Matching van datasets en dataverrijking van tijdschriftrecords (Voorkeurstitel)
Locatie Download het volledige rapport via de projectpagina
Uitgever
Jaar van uitgave 2023
Rechten CC-BY
Persistent ID


Na het zoeken en analyseren van datasets, werd een methodiek voor matching van tijdschriften uitgewerkt met input van de projectpartners. De strategie werd uitgeprobeerd op een testset. Lees alle stappen in het onderzoeksrapport.

Lessons learned:

  • De bibliotheekdata die KADOC wilde gebruiken was veelal niet gepubliceerd als opendata.
  • In plaats van linked open data (LOD) kan beter gesproken worden over linked open usable data (LOUD), want niet alle gepubliceerde opendatasets zijn even bruikbaar. Wie zijn gegevens wenst te delen kan daar best rekening mee houden door bv. gebruik te maken van veelgebruikte metadatastandaarden.
  • Er is nood aan een gedeelde persistente unieke identifier om tijdschrifttitels te identificeren en te linken. Enkele mogelijke kandidaten zijn ISSN-nummer en Antilope id, maar zij zijn beperkt inzetbaar. De Wikidata identifier daarentegen is open, eenvoudig te gebruiken en onderhouden. Wikidata kan een hub worden om id’s aan elkaar te verknopen.

Op basis van de resultaten wordt in 2023 een duurzame workflow uitgebouwd om bibliotheekdata te verrijken met links naar gedigitaliseerde exemplaren.