Memorial Museum Passchendaele 1917 (MMP1917) - OSLO in de praktijk bij Namen in het Landschap

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen

Usecase voor de toepassing van OSLO

Context

De deelname van het Passchendaele Museum aan de Werkgroep Implementatie OSLO Erfgoeddata kadert zich binnen het lopende subsidieproject 'inhaalbeweging digitale collectiedata'. In dit subsidieproject focust het museum zich op de registratie, digitalisering en ontsluiting van de deelcollectie 'personalia'. Deze deelcollectie bevat alle objecten die een direct verband hebben met een specifiek persoon (bv. brieven, administratieve documenten, militaria, memorabilia, persoonlijke objecten, etc.). Binnen dit project worden objecten ook ge(her)waardeerd op basis van persoonsonderzoek. Het doel is om de resultaten van dit project zo open mogelijk te delen en hergebruik mogelijk te maken. Daarom experimenteert het Passchendaele Museum met de OSLO uitwisselingsstandaard.

Algemene usecase

Volgens het Passchendaele Museum is de meest relevante usecase van OSLO voor het WOI-erfgoedveld het faciliteren van een kennisnetwerk dat dingen (o.a. objecten), actoren, plaatsen, evenementen en periodes door verschillende databronnen te verbinden. Deze usecase is gebaseerd op het WOI-erfgoedveld, maar gaat eveneens op voor het bredere erfgoedveld. Het steunt op drie factoren:

1) Voor erfgoedinstellingen is de contextualising van objecten belangrijk.

Het verband tussen een object en een persoon, plaats, evenement of periode beïnvloedt de historische waarde van het object. Gegevens over objecten en hun context zijn de grondstof voor verder onderzoek en de publiekswerking van erfgoedinstellingen.

2) Het WOI-erfgoedveld beschikt over een grote hoeveelheid gegevens bewaard in afzonderlijke databanken.

Het gaat om gegevens over objecten in collectiemanagementsystemen, over boeken en archieven in bibliotheek- en archiefbeheersystemen en over historische persoonsgegevens in specifieke databanken. Een groot deel van deze gegevens bevindt zich vandaag in het publiek domein.

3) De gegevensuitwisseling tussen deze databanken is beperkt.

Sommige erfgoedinstellingen bieden hun gegevens aan via open bestandsformaten en/of een API, maar er is (nog) geen overkoepelende uitwisselingsstandaard.

Doel en doelgroepen

De doelen en voordelen van dergelijk kennisnetwerk zijn:

  • Het creëren van een gezamenlijk corpus van historische gegevens en hergebruik ervan mogelijk maken.
  • Het bundelen van de krachten van verschillende instellingen en organisaties.
  • Het contextualiseren van dingen, actoren, plaatsen, evenementen en periodes.
  • De vindbaarheid van gegevens en collecties vergroten.
  • Het faciliteren van complexe vragen in functie van onderzoek, collectiemobiliteit en publiekswerking.

De doelgroep voor dergelijk kennisnetwerk zijn in eerste plaats erfgoedmedewerkers en onderzoekers.

  • Collectiebeheerders (bv. i.f.v. collectiemobiliteit)
  • Publieksmedewerkers (bv. terugvinden en zichtbaar maken van informatie)
  • Onderzoekers (i.f.v. Informatie terugvinden, gegevens contextualiseren, etc.)

Er bestaat al een precedent voor een dergelijk kennisnetwerk. In 2013 publiceerden onderzoekers aan Aalto University (Finland) en University of Colorado Boulder (VSA) een dataset met WOI-gegevens als testcase die personen, evenementen en plaatsen met elkaar verbond om primaire bronnen te contextualiseren en vindbaar te maken.[1] Ook Netwerk Digitaal Erfgoed (Nederland) gaat op dergelijke manier aan de slag met Linked Open Data. Het door hun ondersteunde project 'Buitenplaatsen in Lisse' is het resultaat van een kennisnetwerk tussen Cultuur-historische Vereniging ‘Oud Lisse’ en het Kadaster en de Rijksdienst voor het Cultureel Erfgoed (deze video legt kort het project uit).

Het is niet toevallig dat dergelijke usecase door een regionaal museum als het Passchendaele Museum voorgesteld wordt. Als museum met een afgelijnde focus (her)gebruikt of transformeert het MMP1917 grote hoeveelheden gegevens uit databanken van grotere collectiebeherende instellingen (zie het 'Namen in het Landschap' project hieronder als voorbeeld). De beperktere focus van een regionaal museum laat ons toe om hergebruikte gegevens te transformeren, te verrijken of te verbeteren. Deze wisselwerking is een meerwaarde voor grote en kleine erfgoedinstellingen.

Testcase met historische persoonsgegevens

Het verbinden van dingen, actoren, plaatsen, evenementen en periodes (lees: alles) gebeurt niet van vandaag op morgen. In het kader van het lopende subsidieproject gaan we eerst aan de slag met de verbinding tussen personen en objecten. De OLSO standaard voor cultureel erfgoed kan reeds museale objecten en evenementen mappen. Daarom leggen we de focus hier op het mappen van persoonsgegevens.

Een kennisnetwerk rond historische persoonsgegevens zou een meerwaarde zijn voor het WOI-erfgoedveld. De reden hiervoor is de grote hoeveelheid databanken met persoonsgegevens, zowel nationaal als internationaal. Zonder exhaustief te zijn, gaat het bijvoorbeeld om de Passchendaele Archives (MMP1917), de Namenlijst (IFFM), de Belgian War Dead Register (WHI) de bezoekerslijsten van Talbot House, de databank van het Lijssenthoek Military Cemetery bezoekerscentrum en de databank van het Heldenhulde-project (ADVN). Internationale voorbeelden zijn Memoire Des Hommes (Frankrijk), Gräbersuche-Online van de Volksbund Deutsche Kriegsgräberfürsorge (Duitsland), de CWGC-databank (algemene databank voor het Gemenebest van Naties), het AIF Project (Australië), de Canadian Virtual War Memorial (Canada), het NZEF Project (Nieuw-Zeeland).

Verschillende van deze databanken hebben een inhoudelijke overlap, maar beschikken eveneens over een specifieke insteek en unieke gegevens. In het geval van de Passchendaele Archives databank ligt de focus op de Slag om Passendale, het militair-historische en landschappelijke aspect. De gegevens in deze databank zijn voornamelijk afkomstig uit de hierboven vermelde databanken, maar bevatten eveneens unieke gegevens. Deze unieke gegevens zijn afkomstig uit de museale objecten, onderzoeksresultaten of contacten met familieleden van gesneuvelde militairen. Deze situatie is gelijkaardig voor andere projecten, zeker wanneer deze databanken informatie via crowdsourcing verzamelen.

Concrete usecase

De algemene usecase hierboven - het idee van het kennisnetwerk - beschrijft de brede lijnen van erfgoedorganisaties WOI-LOD kunnen gebruiken. Dit kan omgezet worden naar een concreet voorbeeld, namelijk een routeplannerapplicatie. Met de geografische gegevens die het Passchendaele Museum publiceert (zie bv. 'Namen in het Landschap'-project hieronder) kan een routeplannerapplicatie ontwikkeld worden. Deze applicatie stelt een route doorheen het lokale landschap voor op basis van de voorkeuren of interesses van de gebruiker. Het wordt echter interessant als meerdere (WOI) erfgoedinstellingen hun gegevens volgens de OLSO-standaard publiceren. Dan kan de applicatie deze gegevens gebruiken om nieuwe routes te creëren of bestaande routes te verrijken. Dergelijke applicatie verhoogt de zichtbaarheid van alle collecties uit de regio.

Context data MMP1917

Passchendaele Archives databank

De Passchendaele Archives databank verzamelt historische persoonsgegevens van militairen die sneuvelden in WO1. Het onderzoek naar deze militairen start met een aanvraag van familieleden. Veel militairen zijn tot op vandaag vermist (zie Menin Gate, Tyne Cot Memorial). Nabestaanden kregen vaak het antwoord dat hun partner, zoon of broer sneuvelde “in France or Belgium”, zonder verdere uitleg. Hierdoor zijn nabestaanden meer dan 100 jaar later nog steeds op zoek naar antwoorden. Historisch onderzoek kan deze vragen beantwoorden.

Met het onderzoek wil het museum drie vragen beantwoorden:

  • Wie was die persoon?
  • Waar kwam hij om het leven?
  • Wat waren de omstandigheden van zijn overlijden?

De gegevens in de databank zijn verzameld uit publiek toegankelijke bronnen zoals gegevens uit nationale slachtofferlijsten (bv. Commonwealth War Graves Commission, Volksbund Deutsche Kriegsgräberfürsorge, etc.) nationale en internationale archieven (bv. The National Archives, National Library of Canada, etc.), literatuur (bv. regimentsgeschiedenissen), gegevens uit historische objecten en objecten/documentatie (digitaal) ter beschikking gesteld door nabestaanden.

Onze databank bevat:

  • Algemene persoonsgegevens (bv. naam, geboortedatum, sterfplaats)
  • Militaire persoonsgegevens (bv. eenheid, rang, datum van indiensttreding)
  • Geografische data (bv. Mosselmarkt, Passendale; coördinaten)
  • Beeldmateriaal (bv. portretfoto’s)
  • Onderzoeksresultaten (in tekstvorm; zie “mijn verhaal”)
  • Bronnen (archieven, boeken, artikelen, websites etc.)

Deze databank ontstond in 2006 en is sinds 2016 online raadpleegbaar. Deze relationele databank (MySQL) is organisch ontstaan en is over de jaren heen aangepast aan de veranderende noden van het museum. Ook vandaag staan er verbeteringen / wijzigingen op de planning, zoals de connecties van personen collectiestukken of evenementen (bv. de ‘Inname van Westhoek’).

De 'Namen in het Landschap' subset

Deze subset is het resultaat van het 'Namen in het Landschap'-project (2020-2022). Het omvat 1416 gesneuvelde Canadese militairen en is een onderdeel van het grotere Passchendaele Archives project. De basis van dit project zijn twee Canadese archieven, de Commonwealth War Graves Registers en de Circumstances of Death Registers. Op basis van deze bronnen kunnen we ruim 20% van de Canadezen op de Menenpoort een initiële begraafplaats toewijzen.[2] Inhoudelijk verschillen de gegevens van deze subset nauwelijks van de algemene Passchendaele Archives gegevens. De keuze voor deze dataset stamt uit het feit dat deze dataset meer (volledige) geografische gegevens omvat.

  • Geboorteplaats
  • Plaats van dienstneming
  • Plaats van overlijden

Het gaat hier niet enkel om plaatsnamen die op de Getty Thesaurus of Geographic Names of GeoNames terug te vinden zijn, maar ook om zogenaamde "trench" plaatsnamen (bv. Tyne Cot, Dochy Farm, Celtic Wood, etc.) die enkel tijdens WOI gebruikt werden. De autoriteit op dit vlak is TMapper.

Eén van de resultaten van het 'Namen in het Landschap'-project was een interactieve kaart op basis van de geografische gegevens.

Verloop traject MMP1917

Het traject bestond uit vijf stappen onderverdeeld in vijf workshops.

1) Definiëren van een concrete use-case

In de eerste workshop (4/10) werd een concrete use-case bedacht voor het gebruik van de OSLO-standaard in de WOI erfgoedsector.

Het resultaat van deze oefening staat hierboven beschreven.

2) Modelleren van het Passchendaele Archives databank als een graph

In de tweede workshop (11/10) werd de huidige, rationele Passchendaele Archives databank omgezet in een graph.

Deze omzetting focuste zich vooral op modeleren van een (historisch) persoon en zijn/haar verband met een object.

3) Modelleren van het MMP1917-pattern naar het OSLO-pattern

In de derde workshop (18/10) werd het resultaat van de vorige stap omgezet naar een OSLO-pattern.

Tijdens deze oefening bleek dat deze omzetting voorlopig nog niet mogelijk is binnen de huidige OSLO-standaard voor cultureel erfgoed.

Het modelleren was wel mogelijk aan de hand van CIDOC-CRM en Records in Context (RiC).

4) Serialiseren van het OSLO-pattern (+ CIDOC-CRM / RiC) naar JSON-LD

In de vierde workshop (26/10) werd het resultaat van de vorige stap omgezet naar naar JSON-LD.

5) Opmaak documentatie en kennisdeling

[huidige fase]

Ervaringen

Onderzoek OSLO implementatie: use-case en gebruikerservaringen

Het OSLO-traject is een zeer positieve ervaring gebleken. Want het valt moeilijk te ontkennen: de OSLO-uitwisselingsstandaard is op het eerste gezicht intimiderend. Zelfs met een goede digitale basis lijkt OSLO je te confronteren met een onoverkomelijke leercurve. Na meemoo's OSLO-traject zijn deze gevoelens echter verdwenen. Het traject splitst de technologie op in begrijpelijke stappen en laat je stap voor stap de curve beklimmen. Je begint bij je eigen gegevens, die je al goed kent. Voor je het weet heb je de gegevens gemodelleerd en je eerste object uitgedrukt in JSON-LD. Natuurlijk is het einde van de curve niet het eindpunt van de OSLO-implementatie, maar eerder het begin. Die uiteindelijke implementatie zal een uitdaging zijn (zoals alle nieuwe projecten), maar voelt zeker niet als een onoverkomelijk obstakel.

Enkele uitdagingen met betrekking tot OSLO en de implementatie ervan:

1) De huidige OSLO-standaard bezit enkele tekorten.

Zoals hierboven beschreven was het onmogelijk om personen en instellingen te mappen aan de hand van de OSLO-standaard.

Voor gebruik in historische musea en archieven kan OSLO bijvoorbeeld verrijkt worden met standaarden zoals CIDOC-CRM en Records in Context (RiC).

2) Uiteenlopende erfgoedorganisaties zijn niet makkelijk gelijk te schakelen

Dit obstakel komt voort uit de diversiteit van erfgoedorganisaties en bestaat uit twee delen. Enerzijds is het voor kleinere organisaties moeilijk om dergelijke investering te dragen. Dit gaat niet enkel om financiële middelen, maar ook over personeel. Sommige instellingen kunnen de investering niet met eigen middelen dragen én kunnen door hun organisatiestructuur geen subsidies aanvragen. Anderzijds bevinden enkele potentiële partners zich deels of geheel buiten de Vlaams Gewest. Dit maakt een investering in OSLO, als Vlaamse uitwisselingsstandaard, hierdoor niet vanzelfsprekend.

3) Modelleren en mappen wordt snel complex

Aangezien de OSLO-pattern voor meerdere organisaties werkbaar moet zijn, wordt de graph vrij snel complex.

Dit obstakel is niet onoverkomelijk, maar vraagt een goede coördinatie tussen de erfgoedinstellingen in de (deel)sector.

OSLO implementatie: technische voorwaarden

De huidige Passchendaele Archives databank is een rationele databank op basis van MySQL. Om deze databank om te zetten naar OSLO stelde meemoo twee opties voor:

Optie 1: Een extensie bovenop de bestaande SQL-databank om output in JSON LD te krijgen.

  • Voordeel: de invoerinterface blijft behouden en is de goedkoopste optie.
  • Nadeel: het huidige relationele model moet herwerkt worden en is nadien “bevroren”.

Optie 2: Een nieuwe linked data oplossing (triple store of graph databank) vervangt de huidige SQL databank.

  • Voordeel 1: het datamodel is eenvoudiger, flexibeler en makkelijker uitbreidbaar.
  • Voordeel 2: via dezelfde endpoint kunnen wijzigingen of verrijking binnen getrokken worden (en is ten opzichte van optie 1 niet enkel éénrichtingsverkeer).
  • Nadeel: grotere investering, momenteel vrij lage adoptiegraad van deze technologie.

Het Passchendaele Museum zou kiezen voor optie 1.

  • Het uitbouwen van een extensie bovenop de bestaande databank is momenteel realistischer, aangezien de OSLO standaard voor cultureel erfgoed vrij nieuw is (onduidelijk toekomstperspectief) en grote investerngingen voorlopig moeilijk te verantwoorden zijn.
  • Het “bevriezen” van het relationele model hoeft niet noodzakelijk een probleem te zijn. Het huidige model is organisch gegroeid doorheen het project, wat een algemene evaluatie en aanpassing noodzakelijk maakt (onafhankelijk van het OLSO-traject). Tijdens deze evaluatie zal rekening houden met de noden van de OSLO standaard.

Technologische oplossingen voor optie 1.

Miel Vander Sande (meemoo) raadt deze optie ook aan omdat hier al oplossingen voor bestaan.

  • R2RML als taal om relationele databanken mappen naar semantisch model (RDF).
  • Ontop (opensource) of Ontopic Studio (betalend) zijn twee mogelijke softwares om R2RML te implementeren.

De gevaren / nadelen van deze technologische oplossing.

  • Technische partners / ontwikkelaars moeten R2RML eigen maken.
  • De R2RML-taal heeft een vrij steile leercurve.
  • Er is kennis “in house” nodig om de stap naar LOD te maken.

Documentatie

Contact

  1. Törnroos, Juha, Eetu Mäkelä, Thea Lindquist en Eero Hyvönen. World War I as Linked Open Data. (2013).
  2. Dit betekent niet dat de stoffelijke resten van die vermiste Canadezen fysiek kunnen teruggevonden worden. Het is namelijk moeilijk in te schatten in hoeverre de gegevens in de genoemde archieven als correct mogen beschouwd worden. Getuigenissen moeten steeds kritisch gelezen worden: er kunnen immers fouten gemaakt zijn bij de plaatsbepaling, het overschrijven van de gegevens en andere slordigheden. Maar zoals gezegd: deze bronnen vormen vaak een laatste spoor. Het zijn de enige geschreven bronnen die per militair, ongeacht rang, een indicatie geven waar iemand verdween of begraven werd.