SODA:Decomprimeer gecomprimeerde bestanden

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen

Workflow algemeen schonen.jpg

Compressie

Benodigdheden

Wat?

In deze stap zal je compressie van de data ongedaan maken. Datacompressie is een algoritme dat de omvang van bestanden verkleint, zodat ze minder geheugen in beslag nemen:

  • Bij lossy compressie treedt dataverlies op. Informatie en kwaliteit gaan verloren.
  • Bij lossless compressie treedt geen dataverlies op. De gecomprimeerde bestanden blijven echter relatief groot.
  • Bij visually lossless compressie treedt wel gegevensverlies op, maar laat dit voor het menselijk oog of oor geen zichtbare sporen na. Toch moet dit worden beschouwd als een vorm van lossy compressie.

Archiefbestanden kunnen afzonderlijk gecomprimeerd zijn (bijvoorbeeld LZW, JPEG of ZIP in een TIFF of PDF-bestand), maar vaak gebeurt het dat verschillende archiefdocumenten in gecomprimeerde mappen verpakt zitten (.tar, .zip). Welke compressie toegepast werd, kan je afleiden uit de extensie van de bestanden of mappen.

Waarom?

Digitale archivering is een reconstructieproces. Hoe meer schakels in dat proces zitten, hoe moeilijker het wordt om toekomstige leesbaarheid van die bestanden te garanderen. Wanneer bij één van deze schakels iets mis loopt, kan het bestand onleesbaar worden. Het risico bestaat dat vele compressiealgoritmes verouderd en overbodig geraken en op die manier een onherstelbare schakel vormen in het reconstructieproces.

Wanneer?

Het decomprimeren van gecomprimeerde bestanden is de eerste stap in de workflow schonen na de integriteitscontrole. Het is aangewezen om eerst alle gecomprimeerde bestanden uit te pakken vooraleer verder te gaan met schonen. In de gecomprimeerde mappen kunnen zich immers nog andere mappen en verschillende bestanden bevinden.

Hoe?

In de toolbox zit software om bestanden en mappen te decomprimeren. Je kan hiervoor ook zelf software installeren op je werkstation. Mogelijkheden zijn:

Opgelet!

Wanneer veel mappen versleuteld zijn, kan je eerst de encryptie wegwerken. De kans bestaat dat in versleutelde mappen ook gecomprimeerde mappen/bestanden zitten die de software niet zal decomprimeren zolang ze in de versleutelde map zitten. Omgekeerd kan ook: in gecomprimeerde mappen kunnen zich versleutelde bestanden/mappen bevinden. Wanneer zulk scenario zich aandient, herhaal dan gewoon de stappen decomprimeren en versleutelingen verwijderen.

Meer lezen?

POPPE, J., Handboek digitaliseren van documenten. Technische aspecten en kwaliteitseisen, FARO, 2011

BOUDREZ, F., Digitaal archiefbeheer in de praktijk, EDAVID, 2004