Publicatie:Handleidng JHOVE/JHOVE: Wie? Wat? Waarom?

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen


Wie?

JHOVE (JSTOR/Harvard Object Validation Environment) werd ontwikkeld door JSTOR en Harvard University Library met de steun van The Andrew W. Mellon Foundation en is een opensource component voor de bouw van digitale repository's.

JHOVE werd actief ontwikkeld tussen 2003 en 2009. De eerste versie werd vrijgegeven in 2005. Sinds 2008 wordt de broncode verder beheerd door een Sourceforge community. In 2010 werd gestart met de ontwikkeling van een tweede versie van JHOVE, waarbij de broncode volledig herschreven wordt. Dit project heet JHOVE2 en van deze software is voorlopig enkel een command line-versie beschikbaar.

Wat?

JHOVE maakt het mogelijk om digitale bestanden die in een OAIS- conform digitaal repository worden opgeslagen, volautomatisch te identificeren, valideren en de nodige administratieve en structurele metadata op te slaan, ook in XML.

JHOVE werd oorspronkelijk ontwikkeld als een command line-tool, maar er is ook een Glossarium:Graphical User Interface-versie. Beide versies hebben dezelfde functionaliteiten, maar via de grafische gebruikersinterface kun je enkel afzonderlijke bestanden analyseren, terwijl de command line-versie ook hele mappen kan analyseren. De tool identificeert bestanden en controleert of welgevormd en/of valide zijn.

Bij het beheer van digitale bestanden kun je JHOVE gebruiken voor drie verschillende taken:

  • Identificatie: Ik heb een digitaal bestand. Wat is zijn bestandsformaat?
  • Karakterisering: Ik heb een digitaal bestand met een bepaald bestandsformaat. Wat zijn de formaatspecifieke kenmerken van het geïdentificeerde bestand?
  • Validatie: is mijn bestand welgevormd en/of valide ten opzichte de formaatspecifieke kenmerken van zijn formaat?

JHOVE onttrekt technische metadata aan de bestanden en controleert vervolgens de wijze waarop de inhoud van het bestand gecodeerd is. Als de eigenschappen van de codering overeenkomen met de technische metadata die het bestand identificeren, is het bestand welgevormd en valide:

  • welgevormd betekent dat de syntaxis (de volgorde van de bytes) van het bestand beantwoordt aan de criteria van het bestandsformaat.
  • valide betekent dat het bestand ook aan een aantal inhoudelijke criteria voldoet.

Om de codering te controleren maakt JHOVE gebruik van modules die voor een bepaald bestandstype een aantal eigenschappen van de codering controleren. Op dit moment zijn er negen:

  • AIFF
  • GIF
  • HTML
  • JPEG
  • JPEG 2000
  • PDF
  • TIFF
  • WAVE
  • XML

Voor deze negen bestandstypes kan JHOVE gedetailleerde technische metadata exporteren en vervolgens opslaan in XML. JHOVE maakt daarbij gebruik van de standaarddatastructuren die beschreven worden door de NISO Z39.87 Data Dictionary for digital still images en de AES57-2011:Standard for audio metadata. Wanneer JHOVE een ander bestandstype aantreft, zal het enkel de integriteit van de karaktercodering controleren. JHOVE controleert volgende karaktercoderingen.

  • ASCII
  • BYTESTREAM
  • UTF-8

Voor deze bestanden kan JHOVE slechts een beperkt aantal technische metadata-elementen exporteren.

Waarom?

Een identificatie- en validatieprogramma als JHOVE is een nuttig hulpmiddel bij het beheer van digitale bestanden.

  • JHOVE vertelt je welk type bestanden je digitale collectie bevat en welke technologie je nodig hebt om deze bestanden te openen en te bewerken.
  • Voor negen courante bestandstypes kan JHOVE gedetailleerde technische metadataprofielen samenstellen en controleren of de bestanden valide zijn.
  • JHOVE biedt de mogelijkheid om deze technische gegevens te exporteren in een XML-bestand en ze te integreren in je collectiebeheersysteem.