Publicatie:Resurrection Lab deliverable - L.2.1. Volledige documentatie van het capteerstation

Uit Cultureel Erfgoed Standaardentoolbox
Ga naar: navigatie, zoeken


Samenvatting

In maart 2017 zijn PACKED vzw en iMAL gestart met Resurrection Lab, een tweejarig onderzoeksproject dat financieel wordt ondersteund door Innoviris, het Brusselse Instituut voor Onderzoek en Innovatie. Het doel is zowel methodes, tools en diensten voor de preservering van born-digital content te implementeren als een mediabibliotheek te creëren die is gebaseerd op emulatie. Die techniek, waarbij een hardwareplatform op softwarematige manier wordt gesimuleerd, biedt mogelijkheden voor de ontwikkeling van een preserveringsstrategie voor digitale creaties.

PACKED vzw is binnen Resurrection Lab verantwoordelijk voor het opzetten van een capteerstation voor de meest voorkomende obsolete dragers en het uitwerken van workflows om de data van obsolete dragers te capteren. Delivrable L.2.1. geeft een beschrijving van de componenten van het capteerstation en de workflows.


Referentie
Titel Resurrection Lab: deliverable L.2.1. Volledige documentatie van het capteerstation (Voorkeurstitel)
Locatie
Uitgever
Jaar van uitgave 2018
Rechten CC-BY-SA
Persistent ID


Auteur(s)

Nastasia Vanderperren (PACKED vzw)

Inleiding

In maart 2017 zijn PACKED vzw en iMAL gestart met Resurrection Lab, een tweejarig onderzoeksproject dat financieel wordt ondersteund door Innoviris, het Brusselse Instituut voor Onderzoek en Innovatie. Het doel is zowel methodes, tools en diensten voor de preservering van born-digital content te implementeren als een mediabibliotheek te creëren die is gebaseerd op emulatie. Die techniek, waarbij een hardwareplatform op softwarematige manier wordt gesimuleerd, biedt mogelijkheden voor de ontwikkeling van een preserveringsstrategie voor digitale creaties.

Het preserveren van born-digital content vereist dat de digitale inhoud eerst van de obsolete gegevensdrager naar een hedendaagse gegevensdrager overgebracht wordt. PACKED vzw is binnen Resurrection Lab verantwoordelijk voor het opzetten van een capteerstation voor de meest voorkomende obsolete dragers en het uitwerken van workflows om de data van obsolete dragers te capteren.

Methode

Om gegevens van obsolete dragers te capteren, werd gekozen om disk images te maken. Disk images zijn bit-voor-bitkopieën van een drager en benaderen daarom zo dicht mogelijk het origineel. Disk images kunnen softwarematig door een computer gelezen worden als een externe drager (bv. een optische schijf of diskette).

Opzetten van een capteerstation

Verzamelen van leestoestellen en kabels

PACKED vzw heeft apparatuur verzameld voor het lezen van obsolete dragers die het meest voorkomen bij collectiebeherende instellingen: leestoestellen voor Iomega ZIP, SyQuest, Jaz, optische schijven, diskettes en magneto-optische disks. Er werd voornamelijk voor oudere tweedehandsapparatuur gekozen omdat hedendaagse leesapparatuur niet altijd oudere dragers kan lezen of omdat er geen hedendaagse apparatuur meer beschikbaar is.[1] Kabels om de leesapparatuur te verbinden met een computer werden eveneens aangekocht.

Sommige apparatuur konden we via USB met een computer aansluiten. Andere leesapparatuur, zoals de drives voor Jaz, SyQuest en magneto-optische disks hebben een SCSI-aansluiting[2]. Diskettestations moeten via een floppydatakabel aangesloten worden, al beschikken we ook over enkele diskettestations met een USB-aansluiting.

Installeren van het werkstation

Als werkstation werd een Dell-computer aangekocht waarop Bitcurator geïnstalleerd werd. Bitcurator[3] is een gespecialiseerde distributie van Ubuntu die voorzien is van digitale forensische tools om archivarissen en bibliothecarissen te helpen bij de omgang met externe (obsolete) dragers. We kozen voor die software omdat ze open source en gratis is, en voorzien is van verschillende tools om disk images te creëren, analyseren, valideren en erover te rapporteren. Daarnaast werd een Macintosh Powerbook G3 aangekocht om de SCSI-apparatuur te kunnen aansluiten. Die computer beschikt over zowel een SCSI- als USB-ingang.

Het werkstation en de USB-leesapparatuur volstond niet voor het capteren van diskettes. Diskettes bestaan in verschillende formaten en varianten die incompatibel zijn met elkaar en waarvoor eigen leesapparatuur nodig is. We hebben daarom een Kryoflux[4] controller board aangekocht. Dat is een floppy disk controller die via software een diskettestation kan aansturen om een diskette te lezen en die verschillende formaten ondersteunt.

Integriteit van de dragers verzekeren

Wanneer externe dragers aangesloten worden op een computer, bestaat het gevaar dat er extra data op de drager geschreven wordt. Dat kan per ongeluk gebeuren, maar sommige besturingssystemen hebben ook de gewoonte om extra (onzichtbare) bestanden op de drager te schrijven in functie van performantie. Dat maak je onmogelijk door het gebruik van write blockers[5]. Bij dragers die beschikken over een tab om de drager alleen-lezen te maken, werd dat lipje ingeschakeld.

Configuratie

Met de bovenstaande apparatuur werd een opstelling gemaakt die geherconfigureerd kan worden naargelang de drager die gecapteerd moet worden. Omdat er twee types leestoestellen bestaan - leestoestellen met een USB-aansluiting en leestoestellen met een SCSI-aangesluiting - werden voorlopig twee soorten installaties uitgewerkt: één voor USB en één voor SCSI. Het doel is om tot één opstelling te komen waarmee we de SCSI-apparatuur aan de USB-ingang van de Dell-computer kunnen aansluiten. We nog op zoek naar een geschikte kabel om dat te realiseren.

Workflows

Tot slot werd voor iedere opstelling een workflow uitgedacht. De workflows bestaan uit:

  1. het identificeren van de drager om het juiste leestoestel te kiezen;
  2. het leestoestel aansluiten met de write blocker;
  3. de write blocker aansluiten op het werkstation of de schrijfbeveiligingstab op de drager aanzetten;
  4. de drager lezen met behulp van het aangesloten leestoestel;
  5. een disk image maken;
  6. controleren of de disk image een exacte kopie van de drager is;
  7. de disk image op een duurzame manier bewaren.

Testen

PACKED vzw heeft de bovenstaande workflows en configuratie in 2017 en 2018 verschillende keren uitgetest: in de zomer van 2017 werden verschillende types obsolete dragers (Iomega Zip, cd-r en cd-rw, SyQuest en magneto-optische disk) van Opera Ballet Vlaanderen gecapteerd; in april - juli 2018 werden verschillende soorten diskettes van de collectiebeherende instellingen Liberaal Archief, ADVN en HeK gecapteerd.

Rapport

De volledige documentatie van het capteerstation en van de workflows kun je raadplegen in de deliverable L.2.1. Full Documentation of the Capturing Station.

Referentie

  1. Moderne diskettelezers met USB-aansluiting kunnen bijvoorbeeld enkel een bepaald type 3,5-inch diskette lezen, zoals we vaststelden bij het capteren van data van 3,5-inch diskettes van Liberaal Archief.
  2. Voor meer informatie, zie https://nl.wikipedia.org/wiki/SCSI.
  3. Voor meer informatie, zie http://bitcurator.net/.
  4. Voor meer informatie, zie https://kryoflux.com/.
  5. Voor meer informatie, zie https://en.wikipedia.org/wiki/Forensic_disk_controller.

Contactgegevens

Nastasia Vanderperren: nastasia@packed.be