Publicatie:Migratie van audio cd-r discs

Uit Cultureel Erfgoed Standaardentoolbox
Ga naar: navigatie, zoeken


Samenvatting

In deze gevalstudie vindt u een overzicht van van de migratie van audio cd-r discs door het Vlaams Instituut voor Archivering (VIAA). Ze is grotendeels gebaseerd op de resultaten van de registratie door de Content Providers (CP's) en van de migratie door de Service Provider (SP) uit het AMS-registratiesysteem, maar ook gestoeld op eigen ervaringen. VIAA heeft ervoor geopteerd om in deze fase niet de CP’s noch de SP uitgebreid te bevragen naar hun ervaringen bij dit traject, maar houdt dit voor een latere en meer globale evaluatie van digitaliseringsgolf 2, waarvan de migratie van audio cd-r discs deel uitmaakt. Hier zal u dus enkel vaststellingen en vergelijkingen terugvinden van de registratie- en de migratiegegevens, gekoppeld aan de bevindingen van VIAA zelf.

Bij de aanvang van het migratieproject werd uitgegaan van bepaalde geschatte cijfers en voorspellingen wat betreft omvang, timing en budget. Absolute cijfers ontbraken bij de CP's.


Referentie
Titel Migratie van audio cd-r discs (Voorkeurstitel)
Locatie
Uitgever
Jaar van uitgave 2016
Rechten CC-BY-SA
Persistent ID


Auteur(s)

Loes Nijsmans (VIAA) en Rony Vissers (PACKED vzw)

Status

De migratie (en de registratie vooraf) is afgerond. Deze gevalstudie heeft enkel betrekking op de migratie. Voor de gevalstudie over de registratie vooraf, klik hier.

De vooropgestelde timing voor de migratie was van 20 januari tot 1 juli 2015. De migratie van de audio cd-r discs liep van 1 maart 2015 tot 30 september 2015. De migratie is dus iets later gestart dan voorzien. Dit was te wijten aan het tempo van de registratie bij de CP's, vooral bij de CP’s uit Kring 2, die er in een later stadium bij kwamen en dus nog een registratie-opleiding moesten krijgen.

Er werden door de SP in totaal 1.209 cd-r’s verwerkt. Dat is ongeveer een derde minder dan oorspronkelijk werd ingeschat. Dit is deels toe te schrijven aan het feit dat de 200 door het ModeMuseum Hasselt in de inventarisatie opgegeven audio cd-r discs uiteindelijk andere optische formaten dan audio cd-r discs bleken te zijn. Ook bij de andere CP’s waren de uiteindelijke aantallen wat lager dan oorspronkelijk opgegeven.

Daarbij moet nog een belangrijke kanttekening gemaakt worden: er werden oorspronkelijk 1.200 dragers naar de SP getransporteerd. Daar werd echter opgemerkt dat er enkele doosjes waren waarin zich meerdere schijfjes bevonden waarvan de SP geen metadata had ontvangen. Er zat dus niets anders op dan extra records aan te maken in AMS per extra schijf. Die negen audio cd-r discs werden dan verzameld in een extra batch (CDRB02A), maar hoefden dus niet meer fysiek getransporteerd te worden. Zo kwam VIAA op een totaal van 1.209 records, en dus 1.209 digitale bestanden.

Uiteindelijk konden 219 audio cd-r discs niet gedigitaliseerd worden om verschillende redenen (zie verder). Van 990 audio cd-r discs kreeg VIAA dus een digitaal bestand terug.

De gedigitaliseerde audio cd-r discs waren uiteindelijk afkomstig van zestien CP's uit de cultureel-erfgoedsector:

  • ADVN;
  • AMSAB;
  • Cultureel Erfgoed Annuntiaten;
  • Den AST;
  • IFF;
  • KC Antwerpen;
  • Letterenhuis;
  • M HKA;
  • Museum Dhondt-Dhaenens;
  • Museum dr. Guislain;
  • Provinciale Bibliotheek Limburg;
  • S.M.A.K.;
  • Stadsarchief & HIDOC Dendermonde;
  • Stadsarchief Gent;
  • Stadsarchief Waregem;
  • UGent.

Ondanks dat er dus zeven CP's bij kwamen ging het aantal audio cd-r discs toch naar beneden. Deze zeven extra partners behoren tot Kring 2, die in 2014 werd bevraagd en in 2015 CP werden bij VIAA (Kring 2).

Dit migratieproject krijgt bovendien mogelijk later nog een uitbreiding. Bij de CP’s van VIAA kunnen immers nog steeds audio cd-r discs binnenkomen. Daarnaast voorziet VIAA ook om vanaf 2016 zijn groep van CP’s uit te breiden, die op hun beurt nog over audio cd-r discs kunnen beschikken. De audio cd-r discs die op die manier nog aangemeld worden, kunnen gebundeld worden in één of meerdere extra batches, die later gedigitaliseerd kunnen worden door dezelfde SP, Picturae (Heiloo, Nederland).

Probleemstelling

Het Vlaams Instituut voor Archivering (VIAA) werd opgericht in december 2012. De eerste stap was het in kaart brengen van het aandeel audiovisueel materiaal in de collecties van een afgebakende kring partners. Dit waren de cultureel erfgoedinstellingen die gesubsidieerd worden binnen het Vlaams cultureel-erfgoeddecreet, de regionale omroepen en de openbare omroep. VIAA heeft daarop in 2013 samen met FARO en PACKED vzw een globale inventaris opgemaakt van audiovisueel materiaal dat aanwezig was door de inventarislijsten, ingevuld door de instellingen zelf, te verzamelen. Op basis van deze cijfers is beslist om te starten met een eerste digitaliseringsgolf van twee videoformaten (Betacam SP en U-matic) en twee audioformaten (kwartduims audiotape en compact audiocassette).

In 2014 hebben VIAA en PACKED vzw een tweede kring partners bevraagd: de stadsarchieven van de centrumsteden en de cultureel-erfgoedinstellingen die erkend zijn binnen het Vlaams cultureel-erfgoeddecreet. Tegelijkertijd bereidde VIAA haar tweede digitaliseringsgolf voor met zes dragerformaten:

  • Betamax;
  • VCR;
  • open reel video;
  • audio CD-r;
  • wasrol;
  • draadspoel.
Afbeelding 1: cd-r disc.


De omvang van de migratie van de audio cd-r discs werd in augustus 2014 als volgt vastgelegd:

  • VIAA digitaliseert 1.816 audio cd-r discs naar .wav, LPCM, 16bit, 48kHz;
  • aangezien de duurtijd van de audio cd-r discs door de CP's in de inventarisatietabellen meestal niet opgegeven werd, werd er bij de aanbesteding uitgegaan van een gemiddelde van 0,8 uur of 48 minuten per schijfje, dus in totaal ongeveer 1.500 uren.
  • er zijn negen CP's betrokken uit de cultureel-erfgoedsector en geen omroepen:
  • ADVN;
  • AMSAB-ISG;
  • In Flanders Fields Museum;
  • KC Antwerpen;
  • Letterenhuis;
  • M HKA;
  • Provinciale Bibliotheek Limburg;
  • S.M.A.K.;
  • UGent.

Het gaat in dit project enkel over zelfgeschreven audio cd-r discs (Orange Book), maar ook de cd-rw valt hierbinnen. Wat duidelijk niet in de scope van dit project valt zijn commerciële (geperste) cd’s, data-cd’s allerhande, cd-rom en dvd-r(w). Hoe een CP deze formaten uit elkaar kon houden, werd toegelicht in de handleiding voor de CP's. In deze gevalstudie zijn de termen ‘audio-cd-r’ en ‘cd-r’ inwisselbaar.

Een audio cd-r disc bevat zelf al digitale bestanden, we spreken hier dus eigenlijk over migreren of rippen van de inhoud i.p.v. over digitaliseren in de strikte zin van het woord. Voor de gemakkelijkheid wordt in dit rapport echter systematisch gesproken over digitalisering.

Dit rapport behandelt enkel de migratie van de audio cd-r discs uit de cultureel-erfgoedsector (Kring 1 en 2). De 22.000 andere audio cd-r discs van de VRT digitaliseert zij zelf, in een project dat nog loopt tot de zomer van 2016. Hiervoor werd gekozen omdat de VRT enerzijds zelf over alle benodigde apparatuur beschikt, en anderzijds omdat het verpakken en transporteren van de audio cd-r discs een onzinnig grote inspanning zou betekenen, vergeleken met de geringe inspanningen die nodig zijn om een cd-r te migreren.

Bij de aanvang van het migratieproject werd uitgegaan van bepaalde cijfers en voorspellingen wat betreft scope, timing en budget. Die cijfers waren vaak gebaseerd op schattingen omwille van het ontbreken van absolute cijfers bij de CP’s. Tijdens het verloop van het project werd duidelijk dat de vooropgestelde cijfers qua aantal te migreren dragers zouden wijzigen.

Methode

De migratie van de audio cd-r discs werd uitbesteed. Bij de aanbestedingsprocedure kwam het Nederlandse Picturae (Heiloo) als beste uit de bus voor de migratie van dit type audiodragers. Deze Service Provider (SP) stond ook in voor de digitalisering van de Betamax-videocassettes voor VIAA, en werd ondertussen ook geselecteerd voor de digitalisering van de VHS-cassettes.

Voorbereiding

Het door de SP gebruikte opvolgingssysteem ondersteunde het volledige proces en maakte het mogelijk alle onderdelen en handelingen van het proces vast te leggen. De software garandeerde een transparant productieproces en bood een grote flexibiliteit om een groot aantal verschillende taken te realiseren. Dit is een belangrijke eigenschap aangezien audio- of videocollecties onderling vaak van elkaar verschillen. Voor elk nieuw project kunnen nieuwe eisen gelden en andere parameters worden ingesteld in het systeem. Na invoer en controle van de metadata (in xml-formaat), werden er taaklijsten gegenereerd voor de operators.

Tijdens het proces werden met grote regelmaat zogenaamde health checks uitgevoerd. Elke vijftigste te migreren audio cd-r disc was het referentieschijfje. De SP gebruikte de data en metadata van deze audio cd-r om vergelijkingen te maken en een eventuele degradatie van de leeskwaliteit vast te stellen, bijvoorbeeld door een vuil wordende lens van de laser.

Tijdens de voorbereiding werd de metadata met de bevindingen door de operators in de workflow manager ingebracht. Deze metadata bevat ook informatie over de fysieke conditie van elk object, de inspectie en het eventuele herstelwerk dat werd uitgevoerd.

Elke audio cd-r disc werd door de operator voorzichtig uit de jewel case of andere verpakking gehaald. De operator droeg hierbij altijd handschoenen. Als eerste stap werd de barcode van de drager gescand en de beschikbare metadata in het opvolgsysteem van de SP opgeroepen. Vervolgens werd de audio cd-r disc aan een inspectie onderworpen en werden verrichte handelingen en bevindingen in het opvolgsysteem genoteerd.

Elke audio cd-r disc werd met (olievrije) perslucht schoon geblazen waarbij de grootste zorg in acht werd genomen om het schijfje niet te beschadigen. In het geval dat er vuil kleefde aan het schijfje werd dit gereinigd met gedestilleerd water en een zachte katoenen doek. Bij het reinigen van het schijfje met een doek werd er altijd vanuit het midden naar de rand bewogen en werd dus geen cirkelvormige beweging gemaakt. Dat verhoogt namelijk het risico op krassen. Ernstig beschadigde schijfjes, met daarin bijvoorbeeld diepe krassen, werden apart gelegd en aan VIAA gerapporteerd.

Migratie

De SP gebruikte voor het rippen van de audio cd-r discs een opensource software. Het is een Compact Disc Digital Audio (CDDA) Digital Audio Extraction (DAE) tool. De applicatie leest de audio van de audio cd-r discs direct als data, zonder analoge stap ertussen, en schrijft de data naar een .wav, 16 bit LPCM bestand.

De applicatie concentreert zich volledig op het rip-proces en daarnaast op het uitlezen van zo veel mogelijk informatie over de cd-drive zelf. Het kan zelfs de audiodata die ooit op goedkope cd’s is gebrand corrigeren. Deze schijfjes zijn namelijk gevoelig voor bijvoorbeeld verkeerde uitlijning en frame jitter. De applicatie repareert ook de gegevens van cd's die op één of andere manier zijn beschadigd.

De applicatie wordt via command line aangestuurd en is een zeer flexibele, maar ook betrouwbare oplossing. In de library bevinden zich allerlei opties die het mogelijk maken het proces en de voortgang te volgen, fouten te corrigeren en te loggen. De uitleessnelheid kan worden ingesteld. VIAA stond een maximale uitleessnelheid van 8x real time toe. De tool kent een ’analyse cd-drive’-commando waarbij een volledige analyse van de caching, timing en het leesgedrag van de drive wordt gelogged.

Nadat de operator de barcode heeft gescand en de drager correct in de lade van de drive heeft ingelegd, begint de tool automatisch met het extraheren van de data. Gedurende het extractieproces werden de .wav-bestanden lokaal opgeslagen. De operator bediende tussen de zes en maximaal acht drives tegelijkertijd.

Gedurende de extractie kon de operator de voortgang en status van het proces aflezen. Na afloop van het proces werd duidelijk met welk resultaat de extractie is uitgevoerd. De status van de extractie werd in het opvolgingssysteem opgenomen. Een log van het proces (resultaten en correcties) werd automatisch gegenereerd en in het juiste formaat opgeslagen.

Kwaliteitscontrole

Kwaliteitscontrole door VIAA als opdrachtgever

Kwaliteitscontrole bestaat normaliter uit een keten van verschillende opeenvolgende controles:

  • een controle op aanwezigheid van virussen;
  • een controle op volledigheid;
  • een controle op de integriteit van de bestanden;
  • een controle van de bestandsformaten;
  • een controle op conformiteit aan de migratieparameters;
  • een controle van de metadata.

De controle op de aanwezigheid van virussen dient te beletten dat zowel de opgeleverde als reeds in het digitaal archief bewaarde bestanden worden gecorrumpeerd. Bij de ingest van audiovisueel materiaal heeft VIAA voorlopig geen viruscontroles gedaan. Er zijn een aantal andere dingen die wel gebeuren en de noodzaak van viruscontrole verminderen: tijdens ingest worden vanaf VIAA's digitaliseringsgolf 2 de XML-bestanden gecontroleerd a.d.h.v. een XSD (XML Schema Definition). De kans dat er dan nog een virus in zit is klein. De essence wordt niet expliciet gecontroleerd. VIAA vertrouwt erop dat de digitaliseringslabo's hun zaak op orde hebben en virusvrij zijn. De bestanden worden geleverd op LTO-5 tape en ingelezen op Linux-machines, op zich een gecontroleerde omgeving. De hele backend is Linux-gebaseerd; de kans op viruspropagatie is zo goed als onbestaande. Bovendien is viruscontrole een bijkomende en zeer tijdrovende stap is (die qua inspanning vergelijkbaar is met de processing die nodig is bij transcodering van bestanden).

De controle op volledigheid dient te verzekeren dat alle Betamax-videocassettes zijn gedigitaliseerd en dat alle resulterende digitale bestanden door de SP zijn opgeleverd aan VIAA. VIAA voert deze controle uit m.b.v. van persistente identifiers (PIDs). Alle audio cd-r discs werden voorafgaand aan het transport naar de SP door de CP’s geregistreerd in het AMS-registratiesysteem (zie VIAA: registratie van audio cd-r discs voor migratie). Ze kregen daarbij elk een persistente identifier toegekend. Ook de digitale bestanden die het resultaat zijn van de migratie krijgen een dergelijke PID. VIAA controleert op volledigheid door de PID’s van de audio cd-r discs en de PID’s van de digitale bestanden met elkaar te koppelen.

De controle op de integriteit dient te verzekeren dat de bestanden die VIAA ontvangt van de SP volledig en ongewijzigd zijn, en dus niet gecorrumpeerd (bv. doordat er iets is misgelopen tijdens het datatransport of bij het kopiëren van de bestanden). VIAA voert deze controle uit m.b.v. MD5-controlegetallen. Wanneer de SP de digitale bestanden creëert, dient hij voor ieder bestand ook een MD5-controlegetal te creëren. Dit controlegetal dient samen met allerlei metadata te worden opgeslagen in een XML-bestand. Bij de ingest in de digitale archief creëert VIAA opnieuw voor ieder bestand een MD5-controlegetal. Als het MD5-controlegetal in het CSV-bestand (of vanaf VIAA's digitaliseringsgolf 2 XML-bestand) identiek is aan de MD5-controlegetal die tijdens de ingest wordt gecreëerd, is de integriteit van het bestand verzekerd.

De controle van de bestandsformaten doet VIAA door tijdens de ingest in het digitale archief de informatie die hierover is opgenomen in de metadata te verifiëren. De bestandsformaten worden enkel geïdentificeerd. De goede praktijk is echter om de bestandsformaten ook te valideren. Het doel hiervan is te controleren of bepaalde eigenschappen van het bestand conform de standaardspecificaties van het bestandsformaat zijn. Dit vergroot de duurzaamheid van de bestanden. VIAA doet (voorlopig) geen bestandsvalidatie, enkel bestandsidentificatie.

De controle van de metadata dient te verzekeren dat de gewenste metadata door de SP wordt opgeleverd als ingebedde metadata in het bestand of als XML-bestand. Ook deze metadata is belangrijk om de duurzaamheid van de digitale bestanden te vergroten. VIAA doet geen controle van de ingebedde metadata, enkel van de metadata die wordt aangeleverd in de XML-bestanden; VIAA controleert de metadata in de XML-bestanden aan de hand van een XSD. Dit geeft zekerheid dat alle velden correct zijn ingevuld.

De controle op de conformiteit aan de migratieparameters laat VIAA in grote mate over aan de CP’s zelf. VIAA vraagt de CP’s om zelf te controleren of de digitale bestanden een goede kopie zijn van de opnamen op de audio cd-r's en of ze dus beantwoorden aan de kwaliteitsverwachtingen. Wanneer er een probleem is met een bepaald digitaal bestand, kunnen de CP’s dit via het MAM-systeem melden aan VIAA.

Met de SP bestaat er een overeenkomst dat indien er tijdens de kwaliteitscontrole door VIAA en de CP’s fouten worden opgemerkt die het gevolg zijn van het migratieproces, de drager gedurende een bepaalde periode kan worden teruggestuurd naar de SP om het migratieproces te herhalen en een nieuw bestand te creëren. Dit is voorlopig echter nog niet gebeurd.

Testfase

Na de kick-off meeting met de SP en de ondertekening van een contract voor de digitaliseringsopdracht volgt er een testfase. Het doel van de testfase is doorlopen van de opgestelde workflow, zowel aan de kant van de SP als VIAA, met behulp van enkele te digitaliseren dragers. Op die manier kunnen mogelijke problemen worden gedetecteerd. De testfase kan onmiddellijk na de ondertekening van het contract starten, en duurt meestal twee tot vier weken.

Afbeelding 2: overzicht van de verschillende fases in het migratieproces.


De verschillende stappen van de testfase:

Ophaling van de testbatch

  • de SP haalt de testbatch op die bestaat uit dragers die representatief zijn voor het hele migratieproject;
  • de SP haalt de LTO-5 tapes op in het data center van VIAA;
  • VIAA bezorgt XML en XSD voor de testbatch;
  • de SP start de voorbereiding van de migratie van de testbatch;
  • terugkoppeling tussen VIAA en de SP over deze stap.

Controle van de codec en het containerformaat

  • de SP digitaliseert één drager en plaatst een fragment en het MD5-controlegetal op VIAA’s FTP-server;
  • VIAA controleert de codec en het containerformaat van het ontvangen fragment met behulp van ffprobe en mediainfo;
  • VIAA creëert opnieuw een MD5-controlegetal en vergelijkt dat met het controlegetal dat hen door de SP werd bezorgd;
  • terugkoppeling tussen VIAA en de SP; de goedkeuring van VIAA is vereist om over te gaan tot de volgende stap.

Controle van het XML-bestand

  • de SP stuurt VIAA een XML-bestand dat gevuld is met data die is gebaseerd op de gemigreerde proefdrager en een XSD;
  • VIAA controleert dit XML-bestand met behulp van een XSD;
  • terugkoppeling tussen VIAA en de SP; de goedkeuring van VIAA is vereist om over te gaan tot de volgende stap.

Kwaliteitscontrole

  • de SP migreert de volledige proefbatch en plaatst de resultaten samen met de MD5-controlegetallen op VIAA’s FTP-server;
  • VIAA creëert opnieuw MD5-controlegetallen en vergelijkt die met de controlegetallen die hen door de SP werden bezorgd;
  • VIAA controleert de codec en het containerformaat van de ontvangen bestanden met behulp van ffprobe en mediainfo;
  • VIAA gebruikt QCTools om de bestanden te analyseren en stuurt de bevindingen naar de SP; dit proces wordt herhaald tot de resultaten voldoen aan de vooropgestelde verwachtingen;
  • VIAA karakteriseert de bestanden in Mediahaven (VIAA's MAM);
  • VIAA transcodeert de bestanden in Mediahaven (VIAA's MAM);
  • terugkoppeling tussen VIAA en de SP; dit proces wordt herhaald tot de resultaten voldoen aan de vooropgestelde verwachtingen en de goedkeuring van VIAA is vereist om over te gaan tot de volgende stap.

De aspecten die tijdens de testfase worden gecontroleerd tijdens de testfase, zijn:

  • de codec en het containerformaat;
  • de compatibiliteit van de barcode;
  • de workflow van de logistiek en de migratie;
  • de formaten en het proces van de uitwisseling van de metadata;
  • de metadata (in het het XML-bestand);
  • de migratieresultaten.

Het einde van de testfase

  • de bestanden die door VIAA tijdens de testfase zijn goedgekeurd worden voor de rest van het migratieproject beschouwd als referentiebestanden;
  • het leveren van de referentiebestanden gebeurt in twee stappen: eerst tijdens de testfase op VIAA’s FTP-server om het formaat snel te controleren en de start van de pilootfase mogelijk te maken, en daarna tijdens de pilootfase wordt een LTO-5 tape geleverd om de volledige workflow te controleren.
  • afwerking van het de projectovereenkomst tussen VIAA en SP.

Pilootfase

Na de testfase volgt een pilootfase waarbij het proces wordt herhaald met een grotere hoeveelheid audiodragers. De pilootfase kan starten na de goedkeuring van de testfase en duurt meestal een tweetal weken.

De verschillende stappen van de pilootfase:

Ophaling van de pilootbatch

  • de SP haalt de pilootbatch, die bestaat uit willekeurig gekozen bestanden, op op de locatie die wordt aangegeven door VIAA;
  • de SP haalt de LTO-5 tapes op in het data center van VIAA:
  • VIAA bezorgt de SP CSV-bestand voor de pilootbatch (vanaf digitaliseringsgolf 2 is dit een XML-bestand);
  • de SP kan starten met de voorbereiding van de migratie van de pilootbatch;
  • terugkoppeling tussen VIAA en de SP over deze stap.

Doorloop van het proces

  • de SP migreert de pilootbatch;
  • de SP schrijft de bestanden op een LTO-5 tape samen met het MD5-controlegatel en het CSV-bestand (vanaf digitaliseringsgolf 2 is dit een XML-bestand);
  • de SP verwittigt VIAA per e-mail over de verzending van de LTO-5 tape;
  • VIAA stuurt een bevestiging van ontvangst van deze e-mail naar de SP;
  • de SP verstuurt de LTO-5 tape naar het data center van VIAA;
  • de SP stuurt het CSV-bestand per e-mail naar VIAA (vanaf digitaliseringsgolf 2 is dit een XML-bestand);
  • terugkoppeling tussen VIAA en de SP over deze stap.

Kwaliteitscontrole

  • VIAA ingest de content van de LTO-5 tape;
  • terugkoppeling tussen VIAA en de SP over deze stap;
  • de goedkeuring van VIAA is vereist om over te gaan tot de productiefase.

De aspecten die worden gecontroleerd tijdens de pilootfase, zijn:

  • de codec en het containerformaat;
  • de formaten en het proces van de uitwisseling van de metadata;
  • de metadata (in het het XML-bestand);
  • de migratieresultaten.

Het einde van van de pilootfase

  • alle bestanden doorstonden zonder problemen de ingest;
  • alle aspecten zijn voldoende afgestemd om over te gaan naar de productiefase:
  • de terugkoppeling over het wissen van de back-up wordt besproken met de SP.

Resultaten

Batches

De audio cd-r discs werden door VIAA verzameld in twee aparte batches om telkens ongeveer dezelfde hoeveelheden te kunnen aanbieden aan de SP, en tegelijkertijd de CP's voldoende tijd te geven om de registratie af te ronden. De audio cd-r discs van één CP in een batch noemt VIAA een shipment of verzending. In één batch kunnen dus verschillende shipments of verzendingen zitten, en dus ook verschillende CP’s. De eerste batch vertrok op 16 februari 2015; de tweede (en voorlopig) laatste batch op 1 juli 2015. De gemiddelde grootte van een batch was 605 audio cd-r discs. Hier wordt de extra batch waarvan hierboven sprake (zie 3.1 Scope) niet meegeteld omdat die niet fysiek werd getransporteerd. De transporten zijn als volgt in cijfers samen te vatten:

Afbeelding 3: aantallen batches, shipments, verpakkingsdozen en transportbakken in het project.

Materiaal

Voor de verpakking en het transport van de audio cd-r discs werden dozen op maat gemaakt en werden barcodes voorgedrukt. In tegenstelling tot eerdere projecten werd er enkel een barcode op de dragerdoos geplakt en niet op het schijfje zelf. De reden hiervoor is dat het plakken van labels op het schijfje problemen kan veroorzaken bij het afspelen en dus digitaliseren van de audio cd-r disc, maar ook de lijm van de labels kan de audio cd-r disc beschadigen. VIAA heeft er dus voor gekozen om enkel een barcode op het doosje te kleven. Aan de SP werd dan ook gevraagd bijzondere aandacht te besteden aan het voorkomen van vergissingen tussen de drager en zijn doos. Ook de verpakkingsdozen werden voorzien van een barcode zodat er in elke stap van het proces snel nagegaan kon worden in welke doos een drager zich bevond. Er werden in totaal:

  • 1.200 barcodes voor de dragers gebruikt. Oorspronkelijk werden er 2.145 besteld. Dat is 44% te veel en is te wijten aan het verminderde aantal aangeboden audio cd-r discs. Er wordt ook telkens iets te veel besteld om het opduiken van extra materiaal op te vangen. In dit geval was dat niet nodig.
  • 33 barcodes voor de dozen gebruikt. Oorspronkelijk werden er 59 besteld. Dat is eveneens 44% te veel.
  • 33 verpakkingsdozen werden gebruikt. Sinds de opstart van digitaliseringsgolf 2 werkt VIAA met een doostype systeem waarbij verschillende audio- en videoformaten in dezelfde dozen passen. Hieronder staat het overzicht van de verschillende doostypes. Doostype 5 is geschikt voor het verpakken van de audio cd-r discs, maar ook voor kleine formaten ½” open reel video, en in de toekomst ook voor andere optische schijfjes, die vaak in gelijkaardige jewel cases zitten als de audio cd-r discs.
Afbeelding 4: tabel van door VIAA gebruikte dozen en de dragers waarvoor ze gebruikt worden.


Voor de audio cd-r discs werden dozen op maat gemaakt. Bij het kiezen van de maat werd rekening gehouden met:

  • de grootte en het gewicht van de audio cd-r dics zelf;
  • de maat van de transportbakken waarin de dozen werden geplaatst tijdens transporten;
  • eventueel hergebruik van bestaande doostypes uit de eerste digitaliseringsgolf;

De doos had volgende afmetingen:

Afbeelding 5: de eigenschappen van doostype 5.


In tegenstelling tot eerdere digitaliseringsprojecten van audio- en videomateriaal, werd er op deze drager geen barcode gekleefd. Dit omwille van het schadelijke effect van lijm op het optische schijfje en het eventueel blokkeren van de afspeelapparatuur door het label tijdens het afspelen.

Omwille van de kleine oppervlakte op de dragerdoos en het niet overplakken van metadata die aanwezig zou zijn op de doos, heeft VIAA ervoor geopteerd om de kleinste barcodes te gebruiken (50 x 12 mm).

Het gebruik van de barcodes is zeer efficiënt gebleken, er is geen enkele drager verloren gegaan.

Duur

Bij de aanbesteding werd uitgegaan van een gemiddelde van 48 minuten per audio cd-r disc, uit de registratie werd een gemiddelde duurtijd van 43 minuten en 25 seconden afgeleid.

Tijdens de digitalisering zelf werd de duur van de audio cd-r discs opgemeten. In de regel werd de hele audio cd-r disc van begin tot einde gedigitaliseerd. Van de 990 gedigitaliseerde audio cd-r discs was de kortste 7 seconden; de langste duurde 1 uur, 19 minuten en 57 seconden.

  • De gemiddelde duurtijd van de gedigitaliseerde audio cd-r discs is 38 minuten en 34 seconden.
  • De totale duurtijd van alle gedigitaliseerde audio cd-r discs is 636 uren 14 minuten 39 seconden.

Met dit laatste cijfer kan ook een vergelijking worden gemaakt tussen de duurtijd zoals ingeschat tijdens de inventarisatie (een cijfer dat ook gebruikt werd bij de opmaak van de aanbesteding), de duurtijd zoals die uit de registratie naar voren kwam en de duurtijd zoals die werkelijk bleek te zijn tijdens de digitalisering. Dat leidt tot deze conclusie:

Afbeelding 6: vergelijking tussen de totale duurtijd van alle audio cd-r discs samen, zoals voorzien in de aanbesteding, zoals geregistreerd en als resultaat van de digitalisering.


Bij de aanbesteding werd er dus door ons een overschatting gemaakt van ca. tien minuten of ongeveer 20%, terwijl de CP’s er dichter bij zaten maar alsnog de duurtijd gemiddeld vijf minuten langer inschatten dan de realiteit.

Deterioratiefenomen

Op een totaal van 1.209 cd-r’s werden door de CP's maar 74 deterioratiefenomenen waargenomen. Er konden uiteindelijk echter 219 cd-r’s niet gemigreerd worden, dat is bijna drie keer zoveel. Hier past wel de opmerking, dat het eigen is aan audio cd-r discs dat men er vaak niet aan kan zien of ze afspeelbaar zijn of niet. Een zichtbare beschadiging is een aanwijzing, maar vormt geen zekerheid. Anderzijds kunnen ook audio cd-r discs waaraan geen schade of deterioratie te zien is, toch niet-afspeelbaar blijken.

Niet-gedigitaliseerde audio cd-r discs

Tegen het einde van het project kreeg VIAA een rapport van de SP met 217 audio cd-r discs die niet gemigreerd konden worden en de reden waarom. Deze problemen konden over het algemeen in vier categorieën worden ondergebracht:

  • afgebroken na twintig minuten geen signaal (11)
  • foutmelding of blijft hangen (3)
  • niet leesbaar (200)
  • niet leesbaar, geen audio cd-r disc (3) maar wel:
    • mini cd
    • DVD-r
    • MP3-cd

Uiteindelijk zijn bij deze 217 nog 2 niet te digitaliseren audio cd-r discs bij gekomen, wat het totaal op 219 of 18% zet.

De migratiemetadata zoals aangemaakt door de SP geven niet meer informatie over de reden waarom de audio cd-r discs niet gemigreerd konden worden behalve de meestal standaardformulering ‘niet leesbaar’. Om de precieze reden te kennen, zou een diepgaandere analyse nodig zijn, bijvoorbeeld door een bit- per-bit uitlezing van de schijfjes, waarbij de locatie van de bits wordt uitgezet op een schematische voorstelling van de schijfjes. Een dergelijke analyse viel buiten de scope van het project, maar gezien het hoge aantal dragers dat niet gedigitaliseerd kon worden (18%), zou VIAA dit wel in een zijproject meer in detail kunnen onderzoeken.

Transport

VIAA verwacht in haar digitaliseringsprojecten dat de SP het transport verzorgt van de dragers heen en terug. Tijdens het transport worden de kartonnen dozen met dragers geplaatst in plastieken transportbakken, die voorzien worden door de SP. Normaliter haalt de SP alle dragers op bij de verschillende CP’s die in één batch zitten. Vermits de SP echter transport doet van en naar Heiloo, en dus niet zoveel plaatsen op één dag kan aandoen, is met VIAA overeengekomen dat VIAA zelf de dozen op één centrale locatie verzamelde per batch. Dit betekende extra werk en verantwoordelijkheid voor VIAA; dit was een tegemoetkoming van VIAA aan de SP.

Achteraf gezien heeft VIAA, bij kleine projecten als dit, het werken met transportbakken voorzien door de SP als minder positief ervaren omwille van:

  • de extra transporten van lege bakken (heen en terug);
  • geen controle over de kwaliteit van de bakken.

VIAA kiest ervoor om in toekomstige projecten eigen transportbakken te voorzien.

Bronnen

Verwante gevalstudies:

Contactgegevens

Loes Nijsmans, project manager digitalisering VIAA

tel: +32 9 298 0501

e-mail: loes.nijsmans@viaa.be