Publicatie:VIAA: Registratie van audiocassettes voor digitalisering

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen


Samenvatting

In deze gevalstudie vindt u een bondig overzicht van de registratie die vooraf ging aan digitalisering van compact audiocassettes door het Vlaams Instituut voor Archivering (VIAA). Ze is gebaseerd op de resultaten van de registratie door de Content Providers (CP's) in het AMS-registratiesysteem van VIAA.

Bij de aanvang van het digitaliseringsproject werd uitgegaan van bepaalde geschatte cijfers en voorspellingen wat betreft omvang, timing en budget. Absolute cijfers ontbraken bij de CP's. Zowel voor VIAA als CP's zelf was de registratie dus een manier om de te digitaliseren collecties beter te leren kennen.


Referentie
Titel Registratie van audiocassettes voor digitalisering (Voorkeurstitel)
Locatie [ ]
Uitgever
Jaar van uitgave 2015
Rechten CC-BY-SA
Persistent ID



Auteur(s)

Loes Nijsmans (VIAA)

Abstract

In deze gevalstudie vindt u een bondig overzicht van de registratie die vooraf ging aan digitalisering van compact audiocassettes door het Vlaams Instituut voor Archivering (VIAA). Ze is gebaseerd op de resultaten van de registratie door de Content Providers (CP's) in het AMS-registratiesysteem van VIAA.

Bij de aanvang van het digitaliseringsproject werd uitgegaan van bepaalde geschatte cijfers en voorspellingen wat betreft omvang, timing en budget. Absolute cijfers ontbraken bij de CP's. Zowel voor VIAA als CP's zelf was de registratie dus een manier om de te digitaliseren collecties beter te leren kennen.

Status

De registratie (en de daaropvolgende digitalisering) zijn afgerond.

De vooropgestelde timing voor de registratie was van 1 december 2013 tot 1 juni 2014. De effectieve registratie liep van 9 december 2013 tot 26 september 2014. De eerste cassette werd geregistreerd door AMSAB-ISG, de laatste cassette werd geregistreerd door Letterenhuis. Dit is enkele maanden langer dan in de originele planning voorzien, maar dit is gemakkelijk te verantwoorden in het licht van de grotere aantallen.

Deze gevalstudie heeft enkel betrekking op de registratie. Voor de gevalstudie over de digitalisering, klik hier.

Probleemstelling

VIAA werd opgericht in december 2012. De eerste stap was het in kaart brengen van het aandeel audiovisueel materiaal in de collecties van een afgebakende groep partners. Dit waren de cultureel-erfgoedinstellingen die gesubsidieerd worden binnen Cultureel-erfgoeddecreet, de regionale omroepen en de openbare omroep VRT. VIAA heeft daarom samen met FARO en PACKED vzw een globale inventaris opgemaakt van audiovisueel materiaal dat aanwezig was, door inventarislijsten te verzamelen die werden ingevuld door de instellingen zelf. Op basis van deze cijfers is beslist om te starten met een eerste digitaliseringsgolf van twee videoformaten (Betacam SP en U-matic) en twee audioformaten (kwartduims audiotape en compact audiocassette).

Bij de aanbestedingsprocedure kwam het Brusselse digitaliseringslabo SONIM Production als beste uit de bus voor de digitalisering van de compact audiocassettes. In dit digitaliseringsproject waren enkel partners uit de cultureel-erfgoedsector betrokken, VIAA’s partners uit de omroepsector hadden geen nog niet gedigitaliseerde audiocassettes in hun bezit.

De scope van de registratie die voorafging aan de digitalisering van de compact audiocassettes werd begin juni 2013 als volgt vastgelegd:

Bij de aanvang van het digitaliseringsproject werd uitgegaan van bepaalde cijfers en voorspellingen, niet alleen betreffende de omvang, maar ook betreffende timing en budget. Die cijfers waren vaak gebaseerd op schattingen omwille van het ontbreken van absolute cijfers bij de CP's. Tijdens het verloop van het project werd duidelijk dat het vooropgestelde aantal dragers overschreden zouden worden. Dit kwam niet alleen doordat VIAA's partners nog steeds nieuw materiaal verwierven, maar ook doordat er vaak geen exacte inventariscijfers bestonden.

Methode

Tijdens de voorbereiding en de registratie werden metadata verzameld in het registratiesysteem AMS. Dat registratiesysteem werd op maat ontwikkeld voor VIAA door het Amerikaanse AVPreserve.

De metadata die nodig waren voor de digitalisering en transport werden ingegeven door de CP's zelf. Er waren achttien registratoren aan het werk die samen gedurende honderd werkdagen hebben geregistreerd. (Hierbij wel moet opgemerkt worden dat de meeste registratoren niet de hele dag aan de registratie van audiocassettes werkten.) Om de registratie zo vlot mogelijk te laten verlopen, voorzag VIAA een gedetailleerde (interne) handleiding voor de CP's. Hierin stonden onder andere de verschillende kenmerken van een compact audiocassette beschreven, alsook een toelichting bij alle velden die in te vullen waren in AMS. Er werd ook aan de registratoren ter plaatse een opleiding gegeven door een VIAA-medewerker. Er werden 5.220 cassettes of 47% manueel geregistreerd door de CP's (dus 52,2 cassettes per dag). Op 24 februari 2014 werden de meeste cassettes geregistreerd nl. 191; op 18 april 2014 werd het minste cassettes geregistreerd, nl. 1. De resterende 5.534 cassettes werden geregistreerd doordat VIAA-medewerkers reeds bestaande metadata in bulk importeerden in AMS.

De registratie was zowel voor VIAA als de CP's zelf een manier om de te digitaliseren collectie beter te leren kennen.

Fig. 1: het invulformulier voor de registratie van audiocassettes in AMS

Resultaten

Content Providers

Er werden compact audiocassettes van twintig verschillende CP's geregistreerd in dit digitalisatieproject. Enkel KADOC werkte niet rechtstreeks in AMS. Hun records werden via de MINT-toepassing in het AMS-registratiesysteem geïmporteerd door een medewerker van VIAA. MINT staat voor Metadata Interoperability, en is een webplatform dat de aggregatie van content en metadata uit de cultureel-erfgoedsector faciliteert. Het kan gebruikt worden voor de ingest, mapping en aggregatie van metadata.

Fig. 2: de vier CP's met de meeste cassettes (>1000 stuks)

AMSAB, KADOC, KCA en UGent vertegenwoordigen samen 8.438 cassettes of 76% van het totaal aantal audiocassettes. KADOC heeft met 3.782 het grootste aantal cassettes; het Museum voor Schone Kunsten (Gent) het kleinste aantal met slechts één cassette.

Merk

Tijdens de registratie werden achttien verschillende merken opgegeven. Van zes merken waren er minder dan vijf cassettes. De meest voorkomende merken representeren 98,5% (10.897 stuks) van het totaal aantal audiocassettes. Hierin zitten ook de opties ‘Andere’ en ‘Onbekend’, die respectievelijk 8% en 28,5% van het totaal aantal cassettes vertegenwoordigen. Als we ‘Andere’ en ‘Onbekend’ eruit halen, komen we tot onderstaande grafiek, waar BASF met 1.901 cassettes er bovenuit steekt als het meest voorkomende merk, kort opgevolgd door Maxell.

Fig. 3: de zeven meest voorkomende merken van audiocassettes (>200 stuks)

Bij dit veld werd in bijna 1/3 van de gevallen ‘Onbekend’ ingevuld. Dit is echter voor 4/5 toe te schrijven aan één bepaalde CP. Hun records zijn afkomstig uit hun eigen database waarin het gegeven ‘merk’ niet was opgenomen. Vermelding van het merk is relevant om bijvoorbeeld te relateren aan deterioratiefenomenen en herstellingen, om te achterhalen of een bepaald merk bepaalde problemen geeft zodat hier op geanticipeerd kan worden door de SP.

Datum

Om de ouderdom van de cassettes in te schatten, werd naar de ‘productiedatum’ gevraagd van de inhoud. Doordat de productiedatum van de audiocassette bijna onmogelijk te achterhalen is, vroegen we om de dichtstbij liggende datum in te geven, hetgeen meestal de datum van opname was. In totaal werden er 57 verschillende jaartallen genoteerd. 3.503 cassettes of 32% kregen een onbekende waarde voor het jaartal (xxxx).

Van de 7.551 resterende audiocassettes dateert de jongste uit 2011. Er zijn ook 23 cassettes aangemeld met een datum die voor het op de markt komen van de cassette zelf ligt (september 1963). Dit heeft meestal te maken met de oudere inhoud. De cassette bevat dus een kopie van de inhoud van een andere drager. Hoe vaak en bij welke gevallen dit gebeurd is, is moeilijk te schatten. Daarom is het ook moeilijk te zeggen welke de oudste cassette is. In ieder geval zijn er audiocassettes aangetroffen die op basis van het type kunnen gedateerd worden aan het einde van de jaren 60. De meeste cassettes dateren uit het jaar 1995; dit is 612, of 5,5% van het totaal aantal audiocassettes.

Fig. 4: de geregistreerde productiedatum van de inhoud van de audiocassettes per jaar

Deze statistiek heeft ook een inhoudelijke waarde en geeft dus een eerste indicatie in verband met de annotatie, als basis voor de toekomstige ontsluiting. Van ongeveer 1/3 van de opnames afkomstig van de audiocassettes is er zelfs geen jaar bekend en zullen archivarissen dus volledig moeten trachten te dateren op basis van de inhoud en/of hun archiefcontext.

  • jaar, maand en dag onbekend: 3.445 stuks of 31% van het totaal aantal audiocassettes;
  • enkel jaar bekend: 4.617 stuks of 42% van het totaal aantal audiocassettes;
  • enkel jaar en maand bekend: 227 stuks of 2% van het totaal aantal audiocassettes;
  • dag en maand bekend, maar jaar onbekend: 58 stuks of minder dan 1 % van het totaal aantal audiocassettes.

Dit betekent dat slechts 2.585 audiocassettes (24%) tot op de dag gedateerd zijn.

Bij maar liefst 31% van de audiocassettes is tijdens de registratie door de CP geen (productie)datum opgegeven. Toch blijft het nuttig dit gegeven te registeren, bv. om te relateren aan de deterioratiefenomenen en de herstellingen, om te achterhalen of een bepaald productiejaar bepaalde problemen geeft zodat hier op geanticipeerd kan worden door de Service Provider (SP) SONIM Production.

Duur

Bij 10.598 audiocassettes op een totaal van 11.054, oftewel 96%, werden volgende duurtijden aangeduid, waarvan 60 en 90 minuten duidelijk de uitschieters zijn. In het totaal zou er volgens de registratie iets meer dan 12.921 uur te digitaliseren geweest zijn. Als we kijken naar de cijfers die we terugkregen van de SP, zien we dat dit in werkelijkheid 15.666 uur was. Er werden dus enkele onnauwkeurigheden gemaakt in de registratie of de aanduiding van de duurtijd door de CP was gebaseerd op een schatting.

Fig. 5: de geregistreerde duurtijd van de audiocassettes

Het is opvallend dat uit de registratie een totale duur van 12.921 uur naar voren kwam (of gemiddeld zeventig minuten per cassette), terwijl de werkelijke duurtijd op 15.666 uur uitkwam (of gemiddeld 85 minuten per cassette). De totale geregistreerde duur is dus maar ongeveer 82% van de totale gedigitaliseerde duur. Voor een deel wordt dit wel verklaard door de marge die op elke cassette aanwezig is (ongeveer zes minuten), maar zeker niet volledig. Daarnaast werd in 369 gevallen de duurtijd als nul minuten aangegeven door de CP, wat de rest kan verklaren. Verder is het opvallend dat er tijdens de registratie was aangegeven dat er meer audiocassettes zouden zijn van 60 minuten dan van 90 minuten (zie Fig. 5). Uit de digitalisering blijkt het tegendeel (zie Fig. 6).

Fig. 6: de duurtijd van de audiocassettes zoals vastgesteld tijdens de digitalisering

Deterioratiefenomenen

Er werd aan de CP's gevraagd om in het AMS-registratiesysteem aan te geven indien er bepaalde deterioratiefenomenen voorkwamen bij de audiocassettes. Ze konden kiezen uit een vaste lijst:

  • gebroken tape;
  • schimmelvorming;
  • sticky shed syndrome (SSS, dit is een reactie van de binderlaag op magnetische tape wanneer deze blootgesteld is aan vocht of temperatuurschommelingen waardoor de tape kleverig wordt, moeilijk tot niet af te spelen, of begint af te schilferen;
  • vreemde geur;
  • andere;
  • geen.

De laatste optie (Geen) stond steeds standaard geselecteerd. Het was ook mogelijk om meer dan een optie te selecteren. Er werden in totaal slechts 35 cassettes met deterioratiefenomenen aangeduid tijdens de registratie:

  • 5 met gebroken tape;
  • 2 met schimmelvorming;
  • 27 met andere problemen (niet gespecificeerd).

Dit lijkt een laag aantal, maar is op zich niet verwonderlijk aangezien bij een audiocassette de magnetische band zit ingekapseld in de cassette, en dus moeilijk zichtbaar is. Het is daarom soms onmogelijk om met het blote oog deterioratieproblemen waar te nemen.

De SP heeft ongeveer dubbel zo vaak een herstelling moeten uitvoeren, als dat er in de registratie een deterioratiefenomeen was vastgesteld. Toch heeft het noteren hiervan de SP geholpen om alvast die cassettes die een zichtbaar probleem hadden, apart te behandelen.

IEC-Type

De chemische samenstelling van de magnetische tape in een audiocassette werd doorheen de jaren enkele malen veranderd. Om de spelers toe te laten een onderscheid te maken tussen deze verschillende types van audiocassettes, werden op de audiocassette verschillende inkepingen gemaakt, of werd het zgn. IEC type aangeduid met een Romeins cijfer op het omhulsel van de audiocassette. Er zijn in totaal vier verschillende IEC types geproduceerd, waarvan type III erg zeldzaam is. Aangezien dit waardevolle informatie is voor de SP, vroeg VIAA aan de CP's om deze informatie te noteren. Het kennen van de samenstelling van de metaallaag van de audiocassette is belangrijk om het mogelijke verval en een goede afspeeltechniek in te schatten.

Fig. 7: schema zoals weergegeven in de registratiehandleiding voor de CP’s

Type I en II zijn de meest voorkomende IEC-types, aangeduid door de CP: samen goed voor 72%. De overige 28% van de cassettes had een onbekend IEC-type. Hoewel het IEC-type niet altijd even makkelijk vast te stellen is, is het een belangrijk gegeven bij de digitalisering. 28% onbekende IEC-types is dan ook een zeer groot aantal, aangezien VIAA in de registratiehandleiding een duidelijk schema meegaf om de verschillende types te herkennen (zie Fig. 7)

Fig. 8: de geregistreerde IEC-types van de audiocassettes

Tijdens de digitalisering heeft SONIM Production deze onbekende IEC-types met zo’n 90% kunnen verminderen (zie de gevalstudie over de digitalisering van compact audiocassettes door VIAA en Fig. 9). Dit lijkt erop te wijzen dat de registratoren niet altijd even ver zijn gegaan in het correct nagaan van dit gegeven, ondanks de gedetailleerde toelichting in de door VIAA voorziene registratiehandleiding.

Fig. 9: de IEC-types van de audiocassettes zoals vastgesteld tijdens de digitalisering

Ruisonderdrukking

De gebruikte ruisonderdrukking is eveneens belangrijke informatie voor de SP. De ruisonderdrukking was echter slechts in 97 gevallen bekend (minder dan 1%), wat bijzonder weinig is. Dolby B komt het meest voor met 79 registraties. De overige 10.957 cassettes hadden een onbekende ruisonderdrukking.

Er moet echter al op de audiocassette of het inlegblaadje in het doosje aangegeven zijn welke ruisonderdrukking gebruikt werd, anders is het op het zicht bijna onmogelijk vast te stellen. Dit was natuurlijk niet altijd het geval, waardoor het een moeilijk gegeven is om in te vullen door de CP. Het is dan ook niet verwonderlijk dat dit door de CP niet vaak ingevuld werd. VIAA kan hieruit concluderen dat dit veld niet voldoet aan criterium 2 (de inhoud van het veld is met enige zekerheid aan te leveren). Toch is het belangrijk om met dit gegeven tijdens de digitalisering rekening te houden, en daarom heeft VIAA beslist om dit veld te houden op basis van criterium 1 (het veld is nuttig voor de logistieke opvolging of het is nuttig voor de SP in het uitvoeren van de digitalisering).

Overige velden

Er werden in het AMS-registratiesysteem ook nog enkele overige velden voorzien die werden toegevoegd op vraag van de CP's:

  • Gerelateerde documenten in de dragerdoos?

Deze checkbox werd toegevoegd zodat de CP kon aangeven of er zich losse documenten met al of niet interessante metadata in de dragerdoos bevonden. Er werd gevraagd deze documenten er uit te halen en apart te houden, aangezien het risico bestond dat deze zouden verloren geraken tijdens het digitaliseringsproces (herhaaldelijk open en dicht doen van de dragerdoos). Na de digitalisering konden doos en documenten dan opnieuw herenigd worden. Slechts in 129 gevallen (1%) werd deze checkbox aangevinkt. Dit lijkt weinig, maar voor de CP's is het wel interessant snel te kunnen zien bij welke cassettes er papieren documenten zaten, zodat ze indien gewenst snel weer bij elkaar gebracht kunnen worden na de digitalisering.

  • Bewaard bij een andere VIAA partner?

Er werd aan de CP's ook gevraagd of zij weet hadden van kopieën of originelen die bij andere partners van VIAA bewaard zouden kunnen worden. In 254 gevallen of 2% werd deze vraag positief beantwoord; deze partner was in alle gevallen VRT. Deze checkbox werd toegevoegd opdat men hierop in het archiefsysteem kan filteren om eventuele dubbels te verwijderen. Het moet nog blijken of deze filter effectief zal gebruikt worden. Toch is dit gegeven ook op een andere manier interessant:

° het biedt de meest aangeduide CP (VRT) de kans om in deze collecties op zoek te gaan naar eventuele archiefstukken die zij zelf niet meer hebben;
° het biedt de oorspronkelijke CP de kans om deze stukken eventueel over te dragen aan de VRT, of indien het om dubbels gaat, te schrappen uit hun eigen collectie.
  • Oorspronkelijk dragernummer

Dit vrije veld werd voorzien opdat de CP hier het inventarisnummer van de drager kon invullen, zoals gekend binnen de organisatie. Op die manier is er altijd een link tussen de VIAA-nummering (PID, d.i. unieke nummering automatisch toegekend aan het record in het AMS-registratiesysteem, en de barcode) en het inventarisnummer van de CP. VIAA heeft steeds aangemoedigd om in het geval er nog geen oorspronkelijk dragernummer bestond bij de CP, deze gelegenheid aan te grijpen om dit te doen. Dit veld werd in 10.552 gevallen (95%) ingevuld, en werd dus nuttig bevonden door de CP en door VIAA.

  • Standplaats drager

Dit vrije veld werd toegevoegd in de registratie zodat de CP na de digitalisering de dragers makkelijk en snel terug kan plaatsen in het archief. Dit veld werd in 3.751 gevallen (34%) ingevuld. Aangezien het geen verplicht veld was en slechts een minimale inspanning vraagt van de CP om het in te vullen, kunnen we aanwezigheid van dit veld als positief evalueren.

Lessons learned

Voor het bepalen van de velden die moesten worden ingevuld door de CP's in het registratieformulier, werd uitgegaan van de volgende drie criteria:

  1. Het veld is nuttig voor de logistieke opvolging (doorheen het volledige traject van de drager) of het is nuttig voor de SP in het uitvoeren van de digitalisering.
  2. De inhoud van het veld is met enige zekerheid aan te leveren. Het heeft geen zin een veld aan te leveren waarvan de inhoud zo onbetrouwbaar is dat het de SP niet helpt.
  3. De inhoud van het veld invullen is technisch en qua timing haalbaar voor de CP. Anders kost dit hem te veel tijd, zeker als men de deadline van de registratie wil halen.

Het niet correct weergegeven van bepaalde gegevens tijdens de registratie kunnen we op twee manieren verklaren.

Enerzijds kan VIAA er niet van uitgaan dat elke registrator dezelfde technische kennis heeft wat betreft het identificeren en het inspecteren van audiovisueel materiaal. Om de registrator bij te staan heeft VIAA echter wel een zeer gedetailleerde handleiding bijgeleverd (zowel op papier als digitaal), waarin de meeste kenmerken van de audiocassette staan uitgelegd en hoe deze te herkennen. We kunnen niet achterhalen of deze handleiding effectief gebruikt werd.

Hoewel de digitaliseringsprojecten van VIAA een grote hulp zijn voor de CP's om de digitaliseringsachterstanden in te halen, mogen we ook niet vergeten dat de registratie, barcodering en verpakking van de dragers moet gerealiseerd worden naast hun dagelijkse werk. Voor CP's met grote hoeveelheden audiocassettes impliceert dit een groot hoeveelheid extra werk. Beide zaken kunnen dus oorzaak zijn waarom de registratie niet altijd even grondig gebeurde.

Van de kant van VIAA waren er enkele veranderingen in de scope, de timing en het budget. Hoewel ze uiteraard niet voorzien waren, waren ze ook niet echt verrassend te noemen. Wat betreft de scope had VIAA geen enkel zicht op de correctheid van de tijdens de inventarisatie opgegeven aantallen. Doordat het aantal audiocassettes 32% hoger lag dan oorspronkelijk ingeschat, moest ook met de timing geschoven worden en zijn we iets langer bezig geweest dan voorzien. Het wijzigen van de aantallen blijkt nagenoeg onvermijdelijk om verschillende redenen:

  • bij het opmaken van de inventaris door de CP's bij de start van het project, werden in sommige gevallen schattingen meegegeven omdat men niet altijd over exacte cijfers beschikte;
  • archieven en musea deden nieuwe verwervingen gedurende het project, waardoor er meer audiocassettes konden worden meegegeven dan oorspronkelijk werd aangegeven;
  • VIAA vertrouwt op de collectiekennis van de CP's en heeft niet de middelen om bij elke partner de aantallen te gaan controleren; wijzigende aantallen wordt dus bij elk project ingecalculeerd.

Ook de gemiddelde duurtijd per cassette werd met 60 minuten per audiocassette vrij zwaar onderschat. Als basis voor deze schatting werd het digitaliseringsproject van het VRT-archief uit 2011-2012 gebruikt, waarin de gemiddelde duurtijd van zo’n 7.300 audiocassettes 1,1u was. Dat in dit VIAA-project de gemiddelde duur een stuk hoger lag, heeft misschien te maken het feit dat het in een radio-archief meestal gaat over radioprogramma’s die vaak een uur duren. Een andere mogelijke reden is dat er voor allerlei getuigenissen, waarvan de neerslag vaak in de cultureel-erfgoedarchieven zit opgeslagen, vaak langere types audiocassettes werden gebruikt.

Tot slot kunnen we concluderen dat dit digitaliseringsproject op alle vlakken een leerproces is geweest voor zowel VIAA als de CP's, maar dat het positief geëvalueerd kan worden. VIAA bedankt de betrokken CP's voor hun inzet en flexibiliteit tijdens het project.

Het project krijgt mogelijk later nog één of meerdere uitbreidingen. Bij de CP's van VIAA kunnen immers nog steeds audiocassettes binnenkomen. Daarnaast voorziet VIAA ook om in de toekomst zijn groep van CP's uit te breiden, die op hun beurt nog over audiocassettes kunnen beschikken. De audiocassettes die op die manier nog aangemeld worden, kunnen gebundeld worden in één of meerdere extra batches, die later nog gedigitaliseerd kunnen worden door dezelfde SP, SONIM Production.

Bronnen

Verwante gevalstudies:

Contactgegevens

Loes Nijsmans, project manager digitalisering VIAA

tel: +32 9 275 31 72

e-mail: loes.nijsmans@viaa.be