Publicatie:Controle van ingebedde metadata

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen


Samenvatting

Deze handleiding handelt over de controle van ingebedde metadata. Ze verduidelijkt eerst wat ingebedde metadata zijn, wanneer je ze controleert en met welke tools je dat kunt doen. Tot slot vertelt ze hoe je ingebedde metadata kunt controleren met behulp van de gratis ExifTool.


Referentie
Titel Controle van ingebedde metadata (Voorkeurstitel)
Locatie
Uitgever
Jaar van uitgave 2020
Rechten CC-BY-SA
Persistent ID


Wat zijn ingebedde metadata?

Metadata kunnen zowel buiten als binnen de beschreven digitale bestanden worden bewaard. Als de metadata buiten het beschreven bestand wordt bewaard, gebeurt dat in bv. een apart rekenblad of een databank. Wanneer ze binnen het bestand zelf wordt bewaard, spreekt men over ingebedde metadata.

Het is belangrijk dat de ingebedde metadata kunnen gebruikt worden door verschillende software en hardware. Dat kan worden verzekerd door het gebruik van internationale standaarden. Zij zorgen er onder meer voor dat soft- en hardware weten waar ze welke ingebedde gegevens kunnen vinden in een digitaal bestand. Men komt ze vooral tegen bij foto-, video- en audiobestanden. Enkele voorbeelden van veelgebruikte standaarden zijn: IPCT Photo Metadata Standard, Exif en XMP.

Tijdens een digitaliseringsproject produceren camera’s en scanners bij het maken van opnamen technische metadata. Deze metadata hebben vooral betrekking op de instellingen van de opnameapparatuur tijdens het digitaliseren. Ze zitten bij het bestand ingesloten.

Wanneer controleer je ingebedde metadata?

In digitaliseringsprojecten kunnen de ingebedde technische metadata gebruikt worden bij de technische beeldcontrole. Daarom is het belangrijk dat de metadata die zijn weggeschreven door de camera of scanner intact blijven.

De Richtlijnen Preservation Imaging Metamorfoze schrijven voor dat indien mogelijk de meegeleverde metadata de volgende gegevens bevatten:

  • datum opname;
  • model scanner of camera;
  • type scanner of camera;
  • kleurruimte;
  • sampling rate (pixels per inch);
  • lengte en breedte in pixels;
  • bitdiepte;
  • kleurprofiel;
  • sluitertijd (indien van toepassing);
  • diafragma (indien van toepassing);
  • ISO-waarde (indien van toepassing);
  • speciale camera of RAW conversie instellingen (indien van toepassing).

Een dergelijke lijst van in te bedden technische en andere metadata wordt dan opgenomen in lastenboeken van digitaliseringsprojecten. Wanneer de digitaliseringsresultaten worden opgeleverd, is het belangrijk te controleren of de gevraagde ingebedde metadata aanwezig zijn en beantwoorden aan de vooropgestelde eisen.

In de Richtlijnen Preservation Imaging Metamorfoze wordt bovendien voorgeschreven om op verschillende momenten tijdens een digitaliseringsproject testkaarten te gebruiken om te controleren of de camera of scanner goed staat ingesteld, o.a. dagelijks voor het opstarten van de digitalisering. De controle van die zogenaamde dagtargets is onderdeel van de kwaliteitscontrole bij de oplevering van de digitaliseringsresultaten. Je meet dan niet alleen de waarden van de verschillende testkaarten, maar vergelijkt ook ingebedde metadata m.b.t. het opnamemoment (datum en uur) en het merk en model van de gebruikte camera en scanner in de dagtargets met gelijkaardige metadata in de digitaliseringsresultaten. Als die niet overeenkomen, zijn de dagtargets niet relevant en kan de kwaliteit van de digitaliseringsresultaten niet adequaat worden beoordeeld.

Met welke tools controleer je ingebedde metadata?

Als je wil achterhalen welke metadata zijn ingebed in je digitale fotobestand, dan kun je dat makkelijk op verschillende manieren doen:

  • Je kunt surfen naar de gratis online metadataviewer Get Metadata en daar je digitale fotobestand opladen.
  • In het de betalende propriëtaire beeldbewerkingssoftware Adobe Photoshop kun je in het topmenu Bestand (File) kiezen en vervolgens onderaan op Bestandsinfo (File info) klikken. Er opent zich dan een scherm met de ingebedde metadata van je fotobestand.
  • In de gratis open source beeldbewerkingssoftware kun je de ingebedde metadata bekijken door in het topmenu Afbeelding (Image) te kiezen, en vervolgens Bekijk metadata (View metadata) aan te klikken.
  • Wanneer je het bestandsformaat van je TIF-bestand valideert met de tool DPFManager, krijg je in de validatierapporten een overzicht van de ingebedde metadata.

Deze tools zijn handig om de ingebedde metadata van één of enkele digitale fotobestand te controleren, maar niet als je dat je wil doen voor grote hoeveelheden bestanden, bv. bij de controle van de resultaten van digitaliseringsprojecten. Een andere, en voor grote hoeveelheden bestanden veel efficiëntere manier om ingebedde metadata te controleren is om ze in de vorm van een spreadsheet te exporteren uit de digitale fotobestanden. Op deze manier is het mogelijk om met weinig handelingen een beeld te krijgen van grote hoeveelheden ingebedde metadata. Je kunt daarvoor de gratis ExifTool gebruiken.

ExifTool verschilt van de bovenvermelde tools doordat hij doorgaans met een command line interface i.p.v. een grafische user interface wordt gebruikt. In plaats van met cursor op een knop te klikken om je computer een bepaald handeling te laten uitvoeren, zul je een commando moeten intikken om je computer die handeling te laten uitvoeren. Omdat de meeste computergebruikers enkel gewend zijn aan het gebruik van een grafische user interface, kan dat afschrikwekkend zijn. Maar wees gerust: het uitlezen van metadata met ExifTool uit fotobestanden vereist slechts zeer eenvoudige commando’s die iedereen zich kan eigen maken, mits een beetje oefening.

Handleiding voor controle van ingebedde metadata met ExifTool

De command line terminal staat standaard op je computer geïnstalleerd. Bij Mac-computers noemt hij Terminal. Je vindt hem door in je finder ‘Terminal’ in te tikken. Als je Terminal opent, krijg je het volgende scherm te zien:

Command line interface.

Daarin zul je de commando’s moeten intikken om ExifTool aan te sturen voor het exporteren van ingebedde metadata van fotobestanden.

De map met fotobestanden waarvan we de metadata in bulk willen uitlezen staat in dit geval op de desktop van onze computer en noemt ‘fotos1’. Ze bevat vijftien fotobestanden, maar zou evengoed 150, 15.000 of zelfs meer bestanden kunnen bevatten.

Schermafbeelding van de map fotos1 met 15 testbestanden.

1. Als we de metadata uit die vijftien bestanden willen uitlezen met behulp van ExifTool moeten we in de command line interface een commando intikken dat de volgende samenstelling heeft: exiftool -csv "pad/naar/csv.csv" "pad/naar/map/met/beelden" Omdat onze map ‘fotos1’ noemt en zich op de desktop van onze Mac-computer bevindt, wordt het commando: exiftool -csv "desktop/fotos1/" > "desktop/fotos1/export_metadata_fotos1.csv"

In mensentaal betekent dit dat je ExifTool de opdracht geeft om van de bestanden in de map fotos1 op de desktop van de computer de ingebedde metadata uit te lezen en ze in de vorm van een CSV-bestand weg te schrijven in dezelfde map op de desktop van de computer (fotos1). In de command line interface zal dat er als volgt uitzien:

Ingevoerde commando: exiftool -csv "desktop/fotos1/" > "desktop/fotos1/export_metadata_fotos1.csv".

2. Vervolgens klik je de enter-toets in van de computer. Nadien verschijnt de volgende mededeling:

De metadata van de vijftien bestanden uit de gevraagde map zijn uitgelezen.

Dat betekent dat ExifTool daadwerkelijk de metadata van vijftien bestanden uit de ene gevraagde map heeft uitgelezen. Als we nu de map Fotos1 openen, zien we dat daar het gevraagde bestand export_metadata_fotos1.csv is toegevoegd.

Het gevraagde bestand export_metadata_fotos1.csv is toegevoegd.

3. Dat CSV-bestand kun je vervolgens openen in rekenbladprogramma’s als LibreOffice, Microsoft Excel of Numbers. Als we het openen in LibreOffice zien we het volgende:

Schermafbeelding van het CSV-bestand met de ingebedde metadata, van kolom A tot I.

Het toegevoegde CSV-bestand bevat zestien rijen: één titelrij en vijftien rijen, waarvan één voor elk fotobestand. Het CSV-bestand bevat ook een groot aantal kolommen, van A tot EP. Als je in het CSV-bestand naar rechts scrolt, zul je zien dat het CSV-bestand informatie bevat over o.a. het pad van de fotobestanden (SourceFile, kolom A), de bestandsnaam (FileName, kolom C), de inhoud van het beeld (ImageDescription, kolom P), de fotograaf (Artist, kolom Y) en auteursrechtelijke status (Copyright, kolom Z). Het bevat verder ook een grote hoeveelheid technische metadata en trefwoorden (Keywords, kolom AO).

Schermafbeelding van het CSV-bestand met de ingebedde metadata, van kolom K tot P.

Op deze manier krijg je in één oogopslag een overzicht van de verschillende fotobestanden in de map fotos1, én hun ingebedde metadata. Omdat de geëxporteerde gegevens in een spreadsheet zitten, kun je door middel van bv. de sorteer- en selectiefuncties van het rekenbladprogramma het document (en dus de ingebedde metadata) gemakkelijk analyseren.