Europeana

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen

Over Europeana

Europeana is een open Europees platform waarin een groot aantal erfgoedinstellingen samenwerken en afspraken maken over standaarden en methodes voor het digitaliseren van cultureel erfgoed.

Europeana is zichtbaar op het www als een portaalwebsite (Europeana Collections: www.europeana.eu) waar in duizenden collecties in Europa erfgoed kan gezocht worden en waarvan de gegevens ook ter beschikking zijn d.m.v. API's. 

De website Europeana Pro (pro.europeana.eu) geeft informatie over Europeana en hoe men eraan kan deelnemen.

Europeana verzamelt inhoud en metadata van erfgoedobjecten die digitaal beschikbaar zijn in deelnemende collecties (content providers of data providers). Oorspronkelijk was Europeana opgevat als een soort super-zoekwebsite met gegevens afkomstig uit betrouwbare bronnen, vanwaar dan voor de inhoud werd doorgelinkt naar de website van de broncollectie.

Inhoud en metadata

Als inhoud (content) wordt beschouwd: de digitale versies van de erfgoedobjecten. Deze kunnen volgende types zijn: TEXT, IMAGE, SOUND, VIDEO of 3D.

Voor de metadata van alle soorten objecten verwacht Europeana data gestructureerd volgens een uniform datamodel EDM (Europeana Data Model). Dit is tot dusver enkel in gebruik voor het uitwisselen van data met of in de context van Europeana. Het wordt niet gebruikt om data te registreren, maar moet per collectie geproduceerd worden door mapping van een export van een inventaris. Weinig of geen collectiebeheersystemen hebben EDM als formaat voor export ingebouwd.

Aggregatoren

Zie: pro.europeana.eu/post/breathing-new-life-into-the-europeana-aggregators-forum

Het leveren van de gegevens aan Europeana gebeurt normaal via een 'aggregator'. Sommige aggregatoren vragen dat hun deelnemers hun gegevens leveren in EDM formaat, anderen behandelen ge-exporteerde gegevens in andere formaten en verzorgen de nodige mapping naar EDM. 

Kennis van EDM is dus meestal niet noodzakelijk voor de collectiebeheerders. Er zijn echter wel enkele vereisten die aan de bron moeten vervuld worden.

Kwaliteit

Het Europeana portaal bevat een korte fiche per geregistreerd object. Kwaliteit van aan Europeana geleverde informatie wordt bepaald en gemeten aan de hand van de definities in het Europeana Data Model EDM en het Europeana Publishing Framework EPF. Dit zijn de belangrijkste kwaliteitskenmerken van data voor het Europeana portaal:

  • vindbaarheid: relevante woorden voor het zoeken (zie EDM, EPF2)
  • zinvolheid: de informatie moet een betekenis hebben, onderscheiden (zie EDM, EPF2)
  • herbruikbaarheid: kwaliteit van het digitale bestand, rechten (EDM, EPF1)
  • meertaligheid: beschikbaar en vindbaar in meerdere talen (EDM, EPF2)
  • semantisch gekoppeld: LOD links naar extern gedefinieerde begrippen (EDM, EPF2)

EDM - Europeana Data Model

EDM is een RDF formaat uitgedrukt als XML, in lijn met de vooropgestelde semantische en LOD ambities van Europeana. In totaal worden een 130-tal elementen gedefinieerd, gespreid over 8 ontologische 'klassen'. Zie: pro.europeana.eu/page/edm-documentation, vooral de documenten 'Mapping Guidelines' en 'EDM Definition'

Verplichte velden

Om geldig te zijn moeten in een EDM objectbeschrijving minstens volgende elementen zinvol ingevuld zijn:

  • in klasse edm:ProvidedCHO
EDM element Specificaties Nuttige elementen in de bron Opmerkingen
edm:type TEXT, IMAGE, SOUND, VIDEO of 3D

Als tekst ingevuld.

Geen relevante elementen in het invulboek Dit is normaal niet aanwezig in een inventaris.

Kan bij de mapping toegevoegd worden op basis van het type digitaal bestand dat aan het record gekoppeld is.

dc:language ISO taalcode (uit ISO 639-2), wanneer edm:type = TEXT Geen relevante elementen in het invulboek Dit veld is niet steeds aanwezig in een inventaris van objecten, maar zou wel kunnen in een beschrijvingsveld zijn aangeduid. Dan kan het eventueel bij de mapping toegevoegd worden als het voorhanden is.
dc:description
  • Minstens één van beide elementen moet aanwezig zijn.
  • Dit zijn velden die als tekst ingevuld worden. De taal van de beschrijving of titel kan met een attribuut xml:lang toegevoegd worden aan het element, met de 2-lettercode voor de taal zoals in ISO 639-2.
Fysieke beschrijving

Iconografische beschrijving

Iconografische beschrijving

De elementen in de broninventaris kunnen meerdere velden bevatten. Deze kunnen dan gepast samengevoegd worden tijdens de mapping naar EDM.
dc:title Titel

eventueel: Taal titel

Aanduiden van de taal van de titel is niet verplicht, maar wel zeer wenselijk, zeker als het een andere taal is dan de standaard taal gebruikt in de inventaris of catalogus.

Het Titel element kan meerdere velden bevatten, waaronder Taal titel.

dc:subject
  • Minstens één van deze vier elementen moet aanwezig zijn, maar meerdere zijn uiteraard toegestaan (en zelfs aangemoedigd).
  • Dit heeft betrekking vooral op de onderwerpen van de inhoud.
  • Ze kunnen ingevuld worden als tekstvelden ofwel als verwijzingen d.m.v. een URI naar concepten uit externe gecontroleerde woordenlijsten of in de EDM meegeleverde conceptbeschrijvingen.
  • dcterms:spatial kan een plaatsnaam zijn, ruimtelijke coördinaten, of de naam van een administratieve locatie.
  • dcterms:temporal kan een periode, datum of tijdspanne zijn.
Afgebeeld concept

Afgebeeld object

Afgebeelde gebeurtenis

Afgebeelde persoon of instelling

Hoofdmotief

De elementen in de broninventaris kunnen meerdere velden bevatten. Deze kunnen dan gepast samengevoegd worden tijdens de mapping naar EDM.

Bij de mapping wordt elk veld in de bron wel ook een apart element in de EDM.

Bij het invullen van deze velden wordt zoveel mogelijk gebruik gemaakt van termen uit thesauri of gecontroleerde woordenlijsten. Best is dan ook bij de term een link te hebben als URI naar de relevante concepten in die woordenlijsten.

dc:type Objectcategorie

Objectnaam

Taxonomie

De elementen in de broninventaris kunnen meerdere velden bevatten. Deze kunnen dan gepast samengevoegd worden tijdens de mapping naar EDM.

Bij de mapping wordt elk veld in de bron wel ook een apart element in de EDM.

Bij het invullen van deze velden wordt zoveel mogelijk gebruik gemaakt van termen uit thesauri of gecontroleerde woordenlijsten. Best is dan ook bij de term een link te hebben als URI naar de relevante concepten in die woordenlijsten.

dcterms:spatial Afgebeelde locatie

(Plaats vervaardiging)

Opgelet: het gaat hier over afgebeelde plaats!

De plaats van vervaardiging kan soms overeenkomen met de locatie van het onderwerp en is dan relevant voor dit EDM element.

dcterms:temporal (Afgebeeld concept)

(Datering)

(Stijl)

Opgelet: het gaat over afgebeelde tijdskenmerken.

In sommige gevallen kan dit als 'Afgebeeld concept' ingevuld zijn.

De datering (of datum van vervaardiging) kan soms overeenkomen met de datum van het onderwerp, maar wordt zelf naar een ander element gemapt in EDM, i.e. dcterms:created

  • in klasse ore:Aggregation
EDM element Specificaties Nuttige elementen in de bron Opmerkingen
edm:dataProvider Naam van de broncollectie (Bewaarinstelling) Dit is in principe wie verantwoordelijk is voor de brondata die aan Europeana geleverd worden, wat normaal overeenkomt met de Bewaarinstelling.

Dit wordt echter best tijdens de mapping door de aggregator ingevuld.

edm:provider Naam van de aggregator Geen relevante elementen in het invulboek Dit wordt door de aggregator toegevoegd tijdens de mapping.
edm:rights Geen relevante elementen in het invulboek Dit gaat over auteursrechten voor mogelijk hergebruik van de digitale bestanden die aan de objectbeschrijvingen gekoppeld zijn. Wie gegevens aanlevert aan Europeana moet garanderen dat die rechten overeenkomen met wat verklaard wordt.

In collectiebeheersystemen wordt die informatie normaal aangeduid bij de metadata van de digitale bestanden. Als die aanduiding op een consistente manier gebeurt kan ze geconverteerd worden naar een Europeana rechtenverklaring tijdens de mapping.

Anders kan ook een geschikte rechtenverklaring gekozen worden die kan toegepast worden voor alle objecten in een dataset.

edm:isShownAt
  • Eén van beide moet aanwezig zijn.
  • Dit moeten geldige URLs zijn van digitale objecten die zonder tussenstappen via Internet bereikbaar moeten zijn.
Geen relevante elementen in het invulboek Dit is normaal de URL van de pagina met de betreffende objectbeschrijving op de website van de broncollectie of de aggregator.
edm:isShownBy Geen relevante elementen in het invulboek Dit is de URL van de directe link naar de primaire digitale versie van het object op de website of server van de broncollectie of de aggregator, meestal dus de eerste, meest relevante foto van het object.

Aanbevolen velden

Een 25-tal andere elementen (gespreid over de klassen) worden aanbevolen, al naargelang de toepasbaarheid voor het betreffende type object. Omdat de data die aangeleverd worden aan Europeana dienen om objecten terug te vinden, is het aangeraden zoveel mogelijk betekenisvolle gegevens naar de relevante EDM elementen te mappen.

Semantische verrijking

Een aantal van de elementen kan ingevuld worden als een tekstveld ofwel met een URI die doorverwijst naar een extern gedefinieerd begrip. Zie pro.europeana.eu/page/europeana-semantic-enrichment#enrich-your-own-metadata voor meer en actuele informatie.

EPF - Europeana Publishing Framework

Het Europeana Publishing Framework klasseert de data in Europeana volgens een aantal kwaliteitscriteria. Zie: pro.europeana.eu/post/publishing-framework

EPF Content (EPF1)

Er worden 4 tiers (niveaus) gedefinieerd - 1 is de laagste, 4 de hoogste kwaliteit - op basis van de resolutie van de aangeleverde digitale afbeeldingen (en vergelijkbare maatstaven voor de andere dan IMAGE bestanden), en de rechten voor hergebruik ervan. Objecten die niet voldoen aan de minimum vereisten van tier 1 worden in principe niet meer aanvaard: d.i. er moet een afbeelding met een minimale resolutie gekoppeld zijn en een aanduiding van rechten gekozen uit het Europeana Licensing Framework (zie pro.europeana.eu/page/available-rights-statements) - voor tier 4 moet de afbeelding minstens 1200 pixels breed zijn en moeten de rechten vrij hergebruik toelaten.

EPF Metadata (EPF2)

Er worden 3 tiers gedefinieerd voor de kwaliteit van de meegeleverde metadata - A is de laagste, C is de hoogste kwaliteit - op basis van aanduidingen van de taal van de inhoud van relevante velden (language attributes), van het invullen van een aantal wenselijke velden (enabling elements), en van het invullen van relevante velden door verwijzing naar elders beschreven concepten (contextual classes). Voor de enabling elements en contextual classes betreft het de verwijzingen naar plaatsen, agenten, concepten en tijdspannen.

Bij voorkeur worden concepten gebruikt uit een aantal externe thesauri of referentielijsten. Dan moeten enkel de URI's van de betreffende concepten worden opgegeven in de geleverde data, en kan Europeana zelf de relevante beschrijvende gegevens ervan ophalen. Anders moeten relevante beschrijvingselementen van elk gebruikt concept meegegeven worden in de EDM. Controleer de lijst van externe gecontroleerde woordenlijsten die gebruikt kunnen worden.