Richtlijn:Ik wil mijn collectiedata beschikbaar stellen voor hergebruik

Uit Cultureel Erfgoed Standaardentoolbox
Ga naar: navigatie, zoeken

Deze richtlijn is van toepassing op het online beschikbaar stellen van collectiedata voor hergebruik, m.a.w. je collectiedata in een machineleesbare vorm op het web plaatsen, waardoor iemand anders een kopie van die data kan verwerken in een andere toepassing. Hierdoor kan de informatie over je collectie, niet alleen via je eigen collectiewebsite, maar ook door anderen verspreid worden. Dat kan bijvoorbeeld door je collectie ter beschikking te stellen aan erfgoedportalen zoals ErfgoedPlus, Erfgoedinzicht of Europeana. Maar je kan collectiedata ook ter beschikking stellen van ontwikkelaars, die ze kunnen gebruiken in mobiele toepassingen of games. In beide gevallen gebeurt de online ontsluiting van je collectie niet alleen via je eigen collectiewebsite, maar schakel je ook externe communicatiekanalen in om je collectie onder de aandacht te brengen.

Deze richtlijn bevat specifieke minimum- en aanbevolen standaarden voor online identificatie, rechtenbeheer, uitwisselbaarheid en bereikbaarheid van machineleesbare collectiedata op het web.

1. Maak de collectiedata uniek en persistent identificeerbaar

Om informatie over een collectie vindbaar te maken, moet die informatie ondubbelzinnig identificeerbaar zijn op het web. De gebruiker moet er zeker van zijn dat de informatie die je op het web zet precies over dat bepaalde object gaat en van jouw organisatie afkomstig is. Ken daarom aan elk object een unieke URI toe en verzeker dat die URI op lange termijn hetzelfde (persistent) blijft.

Minimumrichtlijn

  • Verzeker dat elk object waarvoor collectiedata beschikbaar wordt gesteld op het web een identificatienummer heeft dat uniek is binnen de instelling. (Zie de richtlijnen voor inventariseren.)
  • Gebruik voor het identificatienummer enkel alfanumerieke tekens, hyphens en underscores. Deze tekens kunnen zonder probleem gebruikt worden in een URI.
  • Bepaal voor elk object waarvoor collectiedata wordt gepubliceerd op het web een URI die het object uniek identificeert op het web. Hiermee bepaal je, als beheerder van het 'analoge' object, hoe dit object op het web genoemd wordt.
  • Leg de syntax van de URI waarmee objecten door je instelling worden geïdentificeerd formeel vast.
  • Gebruik een domeinnaam die je instelling controleert: ofwel een domeinnaam waarvan je instelling eigenaar is, ofwel een domeinnaam die eigendom is van een netwerk waar je instelling deel van uitmaakt.
  • Maak gebruik van het HTTP-protocol om de URI te koppelen aan een webpagina (landing page) met de identificatiegegevens van het object. Op die manier kunnen gebruikers van de URI op het web de identiteit van het object verifiëren.

Aanbevolen richtlijn

  • Maak onderscheid tussen het eigenlijk collectiestuk, de collectiedata en digitale representaties: voor elk van hen moet een afzonderlijke URI beschikbaar zijn. Maak hiervoor gebruik van het onderdeel "type document" in de bovenstaande standaard syntax.
  • Gebruik een domeinnaam specifiek voor het publiceren van je collectiedata. Dit laat toe om de URI's van andere pagina's op je collectiewebsite te veranderen, terwijl de URI's van de collectiedata ongewijzigd blijven. Maak hiervoor een subdomein van de huidige domeinnaam voor je instelling. (zie het voorbeeld hierboven)
  • Verhoog de persistentie van de URI voor het object door hem los te koppelen van de digitale locatie van het gekoppelde bestand. Maak hiervoor systematisch gebruik van de HTTP redirect functionaliteiten. Op die manier kan je de collectiedata makkelijk op een andere webserver onderbrengen, zonder dat de URI wijzigt die het object identificeert.
  • Wanneer je instelling de persistentie van de domeinnaam van de URI niet kan garanderen en je instelling niet over een persistente domeinnaam beschikt via een netwerk, maak je bij voorkeur gebruik van externe PID-services. Dit zijn online diensten die een persistente URI's genereren en de koppeling met jouw collectiedata beheren. Voorbeelden van PID-services zijn:

2. Geef aan welke intellectuele eigendomsrechten berusten op het object

Maak alleen collectiedata beschikbaar voor hergebruik over objecten waarvoor je de noodzakelijke rechten bezit om het object online te publiceren. Identificeer daarom, vooraleer je het object online beschikbaar stelt, de intellectuele eigendomsrechten die op het object berusten en documenteer deze rechten in de collectiedata. Indien er beperkingen zijn op de online publicatie van collectiedata en digitale representaties, onderzoek dan of en hoe de nodige rechten overgedragen kunnen worden op de collectiebeherende instelling. Raadpleeg hiervoor de handleiding Rechten klaren in de Publicaties-sectie.

Maak een onderscheid tussen de rechten die rusten op het object, de digitale representatie en de collectiedata. De minimum- en aanbevolen richtlijnen hieronder geven aan hoe je de rechtenstatus van een object publiceert op het web.

Minimumrichtlijn

  • Publiceer als onderdeel van de collectiedata bij elk object een Credit Line die aangeeft of er intellectuele rechten op het object rusten en wie die rechten beheert.
  • Publiceer bij elke digitale representatie een Credit Line die aangeeft wie de intellectuele rechten op de digitale representatie beheert.
  • Geef duidelijk aan onder welke voorwaarden de inhoud van een webpagina beschikbaar gesteld wordt, bijv. door een disclaimer op je website te plaatsen.

Aanbevolen richtlijn

  • Leg de gebruiksrechten van de collectiedata vast in een CreativeCommons-licentie.
  • Leg de gebruiksrechten van de digitale representaties van de werken vast in een CreativeCommons-licentie.


3. Maak de collectiedata uitwisselbaar met andere machines

Om collectiedata uit je collectiebeheersysteem makkelijk te integreren in andere toepassingen, hebben ontwikkelaars precieze informatie nodig over de structuur van de collectiedata. Maak daarom je collectiedata bij voorkeur beschikbaar in een standaard datastructuur waarvan de specificaties vrij beschikbaar zijn en waarvoor binnen jouw collectiedomein al toepassingen beschikbaar zijn. Zie de richtlijnen voor het Inventariseren voor de aanbevolen uitwisselformaten bibliotheken, archieven en musea.

Minimumrichtlijn

  • Gebruik UTF-8 als standaard tekenset voor de codering van de collectiedata. Dit zorgt ervoor dat verschillende computersysteem de cijfer, letters en leestekens correct weergeven.
  • Codeer je collectiedata in een gestructureerd tekstbestand, zoals CSV of XML.
  • Maak bekend in welk(e) datastructuur je de data aanbiedt.

Aanbevolen richtlijn

  • Maak je collectiedata ook beschikbaar gecodeerd in JSON die is een alternatief tekstformaat voor CSV en XML dat voor gebruikt wordt door webontwikkelaars.
  • Gebruik een standaard (XML-)uitwisselformaat, specifiek voor jouw collectiedomein, zoals:
    • LIDO voor museale collecties.
    • MARC of MODS voor bibliotheekcollecties.
    • EAD voor archiefcollecties.
  • Maak de belangrijkste identificatiegegevens uit je collectiedata beschikbaar met behulp van de Dublin Core element set, ook wanneer je je collectiedata al in een domeinspecifiek formaat beschikbaar hebt.
  • Maak je collectiedata beschikbaar als linked data, met behulp van het RDF-datamodel.


4. Maak de collectiedata bereikbaar via het web

De kans dat iemand met jouw collectiedata aan de slag gaat, vergroot aanzienlijk wanneer ontwikkelaars je data ook makkelijk terugvinden op het web. Denk dus goed na welke ontwikkelaars je op het oog hebt en kies de gepaste kanalen om ze te bereiken.

Minimumrichtlijn

  • Meld op een webpagina dat je je collectiedata beschikbaar stelt voor hergebruik.
  • Vermeld op die webpagina minimaal de volgende gegevens over de aangeboden collectiedata:
    • op welke collectie heeft data betrekking;
    • onder welke vorm is de data beschikbaar
    • onder welke voorwaarden is de data beschikbaar;
    • de contactgegevens van de persoon aan wie je toestemming moet vragen om de data te gebruiken en/of bij wie je meer inlichtingen kan krijgen.

Aanbevolen richtlijn

  • Maak de data, indien ze vrij beschikbaar is, online bereikbaar via download of via een API. Er zijn drie manieren waarop je data online bereikbaar kan maken:
    • download: Zet op de webpagina een link naar het CSV, XML of JSON- bestand waarin de data gecodeerd zit. Hierdoor kunnen ontwikkelaars je data gebruiken om toepassingen te testen of om de structuur en inhoud van de data aan te passen voor gebruik in een toepassing.
    • harvesting: Zet op de webpagina een link naar een API waar je op regelmatige tijdstippen de collectiedata volautomatisch kan opladen. Hierdoor kunnen ontwikkelaars en gebruikers steeds over de meest actuele data beschikken in hun applicatie. Voor deze manier wordt gebruik gemaakt van het OAI-PMH protocol. Hierbij wordt de collectiedata standaard beschikbaar gemaakt als Dublin Core, maar je kan ook complexere datastructuren bereikbaar maken via OAI-PMH.
    • dynamische API: Zet op de webpagina een link naar een API waar ontwikkelaars en eindgebruikers ad hoc data kunnen ophalen uit een databank. Dynamische API bevatten doorgaans uitgebreide zoekfunctionaliteiten waardoor je precieze zoekvragen kan stellen aan de API. Een goede dynamische API beantwoordt aan de principes van een zogenaamde REST-full API. Het voordeel van een dynamische API is dat je data rechtstreeks uit een collectiebeheersysteem wordt gehaald en externe applicaties dus steeds over de meest actuele data beschikken. Zorg dat ontwikkelaars beschikken over voldoende documentatie om gebruik te kunnen maken van de API. Controleer of aan het gebruik van deze API's geen extra kosten verbonden zijn.
  • Meld niet alleen op je eigen webpagina, maar ook via externe kanalen dat je data beschikbaar is voor hergebruik. In zogenaamde Open Data Repositories wordt je data aangeboden samen met andere data sets en is ze makkelijker vindbaar voor ontwikkelaars. Kies een of meerdere Open Data Repositories met het oog op de ontwikkelaars die je wil bereiken. Hoe er rekening mee dat sommige Open Data Repositories vereisen dat je data vrij beschikbaar is. Andere Open Data Repositories bieden ook de mogelijkheid om je data als een bestand op te laden en ze vervolgens via een API bereikbaar te maken.