Publicatie:Verslag Expertmeeting Beschrijven van collecties

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen


Samenvatting


Referentie
Titel Verslag Expertmeeting Beschrijven van collecties (Voorkeurstitel)
Locatie [ ]
Uitgever
[packed.be PACKED vzw]
Jaar van uitgave 2010
Rechten
Persistent ID


Trefwoorden

expertmeeting | semantisch web |

Verslag

  • Onderwerp: Verslag expertmeeting beschrijvende standaarden
  • Datum: 2010-06-04
  • Locatie: FARO
  • Aanwezig: Bart Ooghe (Erfgoedcel Meetjesland), Bert Lemmens (AMSAB), Jef Malliet (Erfgoedplus), Peter Heyrman (KADOC), Rosemie Callewaert (BibNet), Willem Vanneste (Stadsarchief Antwerpen), Henk Vanstappen (CEST, verslag)
  • Verontschuldigd: Marco Streefkerk (DEN), David Coppoolse (Erfgoedbibliotheek Vlaanderen), Francis Vlieghe (VVBAD)


Verslag

Inleiding

  • Voorstelronde. Opgemerkt wordt dat Bert Lemmens (nu projectmedewerker bij AMSAB) werd uitgenodigd op basis van zijn functie als projectleider van het MovE-project.
  • Voorstelling van project CEST en de gehanteerde werkwijze. Deze expertmeeting kadert in een brede bevraging van de sector en verwerking van beschikbare expertise betreffende het hanteren van standaarden bij het uitvoeren van digitaliseringsprojecten.
  • Opzet van de expertmeeting: er wordt commentaar gevraagd aan de hand van een aantal use cases, waarvan een ontwerpversie op de projectwiki is gepubliceerd. Er zal worden getracht rekening te houden met de gegeven beperkingen van het opzet, d.i. 'standaarden identificeren die essentieel of aangewezen zijn voor degelijk uitvoeren van een digitaliseringsproject'. Dit moet los worden gezien van verwante problemen en noden aan expertise (projectmatig uitvoeren van digitaliseringsprojecten, selecteren van geschikte software, correct toepassen van standaarden, ...).

Algemene opmerkingen

  • Er wordt gevraagd naar de verhouding tussen CEST en andere projecten, met name BOM-Vl en HMA. Antwoord: (1) expertise van BOM-Vl werd verwerkt in het vooronderzoek, (2) met het team dat het HMA-project uitvoert wordt informatie uitgewisseld en HMA is ook vertegenwoordigd in de CEST stuurgroep.
  • Er is bij erfgoedorganisaties een vraag naar interfaces: waar kan je met je data terecht? Hoe kan je ze openstellen? Kan je daarbij aansluiten bij bestaande initiatieven?
  • Er moet ook rekening gehouden worden met het expertiseniveau van kleine organisaties: daar ligt de keuze vaak tussen zeer beperkt of helemaal niet beschrijven. Hier wordt tegenover gesteld dat beperkte expertise al kan volstaan om - met dezelfde middelen - een beter resultaat te bereiken. Daarom zal gestreefd worden naar het opstellen van een minimum minimorum, naast het formuleren van aanbevolen eisen. De opmerking valt dat dit eigenlijk een valse discussie is: een minimaal kwaliteitsniveau moet geëist worden, zeker wanneer met gemeenschapsmiddelen wordt gewerkt. Expertise is aanwezig bij professionals (cf. archief- en bibliotheekopleidingen), het is niet meer dan vanzelfsprekend dat niet iedereen in staat is erfgoed adequaat te beschrijven. Het gaat niet op deze kennis te negeren en zich tevreden te stellen met een ondermaats niveau.

Metadataschema's - algemene bemerkingen

  • Vele kleinere organisaties beschikken niet over de juiste software om aan de gestelde eisen te voldoen, o.a. omdat die software de vooropgestelde metadataschema's niet ondersteunen. Anderzijds wordt gesteld dat het voldoen aan eisen software-onafhankelijk is en moet zijn: in principe kunnen beschrijvingen net zo goed in een rekenblad worden ingevoerd - al heeft dit weer andere nadelen, o.a. wat betreft foutgevoeligheid van de invoer.
  • Primordiaal is dat gegevens gestructureerd worden ingevoerd. Beschrijvingen in lopende tekstformaat zijn - hoe inhoudelijk relevant ze ook zijn - niet bruikbaar in een digitale omgeving. Zelfs tegen dit basisprincipe wordt echter nog vaak gezondigd (als je een spreadsheet gebruikt om objecten te beschrijven, hoort elke regel één object te beschrijven, niet meer of minder. Dit lijkt evident, maar is het in de dagelijkse praktijk lang niet altijd.
  • Welke velden er worden ingevuld is een minder belangrijke eis, en is ook minder gemakkelijk in regels te vatten: soms volstaat het om met enkel (gestructureerde) gegevens een object voldoende te identificeren. In andere gevallen zijn er slechts minimale gegevens voorhanden.
  • Een belangrijk aandachtspunt is dat het gebruik van een schema niet volstaat: het moet ook correct én consequent gebruikt worden. De nood aan richtlijnen (wat is de betekenis van een veld, hoe vul je een veld in, ...) mag niet worden onderschat. In zekere mate kunnen bestaande richtlijnen en datacontent standaarden (MovE Invulboek, Standaard:RDA of Standaard:AACR) hieraan tegemoet komen. Het juiste, consequente gebruik van schema's moet echter sterk benadrukt worden.
  • De keuze van een metadataschema zou in vele gevallen niet gemaakt moeten worden: het is immers vaak beter aan te sluiten bij bestaande initiatieven (cf. VLACC) en de daar gehanteerde schema's te volgen.
  • Een kwaliteitscriterium om de waarde van metadataschema te toetsen is Standaard:CIDOC-CRM: wanneer een schema in deze ontologie past, is het ook bruikbaar in een breder 'erfgoedverband'.
  • Er moet benadrukt worden dat het aangewezen is 'een' (adequaat) schema te hanteren, en bij voorkeur terug te vallen op een bestaand schema. Welke standaard wordt gehanteerd, is echter minder belangrijk en moet bepaald worden door de behoeften van de organisatie. Zo is een schema als Standaard:CDWA of de minimumnorm van CIDOC beter geschikt voor het registreren van gegevens die van belang zijn voor het beheer van een museale collectie. Schema's als Standaard:Dublin Core of Standaard:LIDO bevatten die 'managementinformatie' niet, maar kunnen erg geschikt zijn voor resource discovery.
  • Voor het beschrijven van gemengde collecties (objecten in archieven, publicaties in museale collecties, ...) kan in principe een keuze gemaakt worden voor het meest geschikte schema. Belangrijk ook hier is dat de juiste woordenlijsten worden gehanteerd (zie verder).
  • Een principe waar tegen nog vaak gezondigd wordt, is het 1-op-1 principe: een record beschrijft steeds een enkel (fysiek of abstract) object of representatie. Vaak worden verschillende representaties nog door elkaar gehaald: bv. wanneer een prentkaart wordt geregistreerd, bevat het beschrijvingsveld informatie m.b.t. het voorgestelde onderwerp. Ook het ESE-schema van Europeana gaat overigens tegen dit principe in.

Metadataschema's en content standaarden - bibliotheekcollecties

  • Standaard:ISBD wordt vaak vermeld als metadataschema door bevraagde organisaties en is ook in de use case zo vermeld. Maar ISBD is eigenlijk geen echte standaard voor metadatastructuur. Standaard:ISBD biedt wel een regelgevend kader (zoals het Standaard:FOBID-kader), en kan dus als standaard voor metadatawaarde worden vermeld.
  • De velden van Dublin Core kunnen mogelijk als minimale standaard vooropgezet worden. Doorgaans is het echter niet specifiek genoeg om alle nuances en details weer te geven.
  • Een schema dat vermelding verdient is Standaard:ONIX: een minimale set van velden die echter in de uitgeverswereld veel wordt gebruikt.
  • Bibliotheekcollecties kenmerken zich door het niet-unieke karakter van de beschreven objecten. Welk schema ook gehanteerd wordt, het is daarom belangrijk een veld op te nemen dat als identificator fungeert. Dit laat toe een beschrijvingen van identieke publicaties achteraf met elkaar te identificeren. Ideaal is het Standaard:ISBN-nummer, maar ook een combinatie van een aantal wezenlijke kenmerken kan volstaan (met name wanneer er geen ISBN voorhanden is).
  • Als contentstandaard kan ook verwezen worden naar het regelgevend kader van de VLACC.

Metadataschema's - archieven

  • Standaard:ISAD(G) geldt als de belangrijkste standaard voor archieven. Er bestaan echter al enkele profielen voor specifieke onderwerpen of sectoren (o.a. voor ngo's).
  • Standaard:ISAD(G) 6 verplichte velden: de referentie, de titel, de archiefvormer, de datering, de omvang en het beschrijvingsniveau. Deze kunnen als minimum eis overgenomen worden.
  • Belangrijk zijn ook de 4 basisprincipes van Standaard:ISAD(G) (m.b.t. multilevel description).
  • De afkorting ISAF komt nog voor op de wiki, maar dit was de vorige benaming van Standaard:ISDF (d.w.z. in de draft-fase).
  • Standaard:ISAAR(CPF) en Standaard:ISDF zijn te vermelden als aanbeveling.
  • Standaard:ISDIAH is minder belangrijk.
  • Ook Standaard:EAC en Standaard:EAD kunnen als aanbeveling gelden.
  • Er kan verwezen worden naar handleidingen voor erfgoedorganisaties [bibliografie aanvullen] als datacontent standaard.

Metadataschema's - museale collecties

  • Voor musea gelden de Standaard:CIDOC-richtlijnen als minimaal schema. Deze gegevensset is gericht op het beheer binnen musea, minder op resource discovery. Standaard:Object ID is dan weer vermeldenswaard omdat het gericht is op het opnemen van unieke, kenmerkende eigenschappen (dit schema werd ontwikkeld met oog op opsporing van objecten na diefstal). Deze elementen zitten ook in CDWA-Core (sic).
  • Standaard:Dublin Core is te minimaal als beschrijvingsstandaard, het is daarom niet aangewezen om deze als minimale standaard aan te duiden.
  • Bij het Standaard:MovE invulboek hoort een document dat drie beschrijvingsniveau's opsomt: een minimaal niveau (komt overeen met CIDOC-norm), het basisniveau (17 velden) en de uitgebreide registratie (alle velden van het invulboek).
  • Als uitgebreider schema komen Spectrum en Standaard:CDWA in aanmerking. Spectrum is geen metadataschema in de strikte zin (SpectrumXML is dat wel), maar sluit beter aan bij de museale praktijk. Om die redenen werden de informatie-elementen van Spectrum door Erfgoedplus als uitgangspunt genomen.
  • Standaard:LIDO is eveneens gericht op discovery, maar bevat geen elementen die het museaal beheer ondersteunen.

Woordenlijsten: algemeen

  • Een algemene opmerking is dat voor interoperabiliteit de standaarden voor metadatawaarden (woordenlijsten) in wezen veel belangrijker zijn dan de keuze voor een bepaald metadataschema.
  • Een belangrijk kwaliteitscriterium voor een woordenlijst is het feit of deze een uniek ID heeft waarnaar verwezen kan worden. Nog beter is het wanneer de woordenlijst ook geskosificeerd is (omgezet naar Standaard:SKOS-formaat).
  • Een derde kwaliteitscriterium is dat een woordenlijst meer moet zijn dan een opsomming van termen: personen-woordenijsten moeten biografische kenmerken bevatten (cf. Standaard:ISAAR(CPF), woordenlijsten die concepten beschrijven moeten scope notes bevatten (zoals Standaard:AAT).

Woordenlijsten: trefwoorden

  • Het belang van Standaard:AAT voor erfgoedcollecties wordt wel erkend. Voor archieven is dit echter minder van belang: 'trefwoorden zijn niet relevant'. Wanneer archieven context willen aangeven, gebeurt dit via namen van actoren (personen, organisaties), plaatsnamen en eventueel historische gebeurtenissen. De vraag is ook of Standaard:AAT (en met name de Nederlandse editie Standaard:AAT-NED) kan aanbevolen worden zolang hij niet voltooid is. Daartegen wordt ingebracht dat een (goede) thesaurus nooit af is, en dit zeker geen beletsel hoeft te vormen.
  • Standaard:AAT heeft zeker relevantie in het gebruik als authority voor materialen en technieken.

Woordenlijsten: personen en organisaties

  • Met name voor archieven is een koppeling met Standaard:ODIS zeker aan te bevelen. Het is niet duidelijk of dit ook voor andere collecties interessant kan zijn. Erfgoedplus maakt al wel gebruik van ODIS .
  • Als schema is Standaard:ISAAR(CPF) geschikt om cross-domain te worden gebruikt. Dit schema bevat immers de essentiële gegevens zoals ID, preferente term, datering en type (persoon of organisatie).

Woordenlijsten: geografische kenmerken

  • Voor het beschrijven van geografische kenmerken is er niet één goede woordenlijst voorhanden: Standaard:TGN is globaal, maar niet specifiek genoeg. Standaard:CRAB is zeer gedetailleerd (tot op niveau van huisnummer en perceel, met geocoördinaten), maar bevat niet alle adressen en is niet foutloos. Een nieuw project is HISGIS, maar het is nog onduidelijk hoe dit verder zal evolueren. Google geeft via een API toegang tot de eigen database. Deze werkwijze is veel flexibeler, maar zeker niet foutloos.
  • Enkele aanbevelingen kunnen wel gehanteerd worden:
    • Kies een lijst die geocoördinaten bevat en een uniek ID.
    • Gebruik ook steeds de meest courante term.
    • Er is geen duidelijkheid of het endoniem of het exoniem moet worden gekozen. Ook dit pleit voor het gebruik van neutrale woordenlijsten, voorzien van een ID waarnaar kan worden verwezen. Dit geeft de mogelijkheid om lokaal een variante benaming te hanteren.