SODA:Controleer de integriteit

From Cultureel Erfgoed Standaardentoolbox
Jump to navigation Jump to search

Workflow algemeen schonen.jpg

Benodigdheden

Wat?

In deze stap wordt de bitintegriteit van de bestanden gecontroleerd.

  • Integriteit: integriteit betekent dat de vorm, inhoud en structuur bij raadpleging van een archiefstuk of archiefbestanddeel gelijk zijn aan de vorm, inhoud en structuur op het tijdstip dat het werd ontvangen of opgemaakt.
  • Bitintegriteit: een bit is de kleinste eenheid voor informatie. Het kan een 1 of een 0 zijn. Meerdere opeenvolgende bits vormen een bitstream. Wanneer in die opeenvolging van nullen en enen iets wijzigt, is de bitintegriteit van dat bestand gecorrumpeerd.

Waarom?

De bitintegriteit van het archief wordt gecontroleerd om zich ervan te verzekeren dat het archief volledig en ongecorrumpeerd is overgedragen. Het controleren van de bitintegriteit vormt een onderdeel van de permanente kwaliteitscontrole.

Wanneer?

Het controleren van de bitintegriteit gebeurt minstens elke keer wanneer het archief naar een andere locatie wordt gekopieerd en wanneer je bepaalde handelingen op het archief uitvoert.

Het controleren van de integriteit is een eerste stap in het schonen van het archief.

Hoe?

Het controleren van bitintegriteit gebeurt door middel van checksums.

Om checksums te controleren, moeten ze in eerste instantie aangemaakt zijn. Dit is idealiter tijdens de bestandsanalyse (prospectie) gebeurd, of de overdrager draagt een lijst met checksums mee over. Wanneer het archief is overgedragen, worden nieuwe checksums gegenereerd. Deze nieuwe lijst wordt vergeleken met de vorige lijst om anomalieën op te sporen. Wanneer de checksum niet meer identiek is met het vorige, is het bestand corrupt.

De checksums controleer je via een tool op je toolbox. Mogelijkheden zijn:

Opgelet!

  • Corrupte bestanden kunnen verwijderd worden, met het oog op de doorzoekbaarheid van de bestanden.
  • Een andere optie is om te documenteren welke bestanden corrupt zijn en ze in het archief te behouden.
    • Corrupte bestanden kunnen immers geen andere bestanden contamineren en de kans bestaat altijd dat in de toekomst een methode ontwikkeld wordt om de bitintegriteit van corrupte bestanden te herstellen.

De integriteit van de bestanden werd reeds gecontroleerd wanneer de bestanden op het werkstation ontvangen zijn. Wanneer je meteen overgaat tot het schonen, zonder het werkstation uit te schakelen, is het niet noodzakelijk om hier terug checksums te controleren. Als er echter een periode verstrijkt tussen de overdracht en het schonen, moeten de checksums wel opnieuw gecontroleerd worden omdat er een risico op dataverlies bestaat.

De archiveringstool Archivematica berekent aan het begin van de import de checksums van alle bestanden en zal ze doorheen het proces van bewerken en schonen meermaals controleren.