Publicatie:De digitalisering van Belgische frontblaadjes, kranten en tijdschriften uit de Eerste Wereldoorlog

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen


Samenvatting

Onder de projectnaam Nieuws van de Groote Oorlog begon het Vlaams Instituut voor Archivering (VIAA) samen met de Vlaamse Erfgoedbibliotheek,FARO,PACKED en dertien cultureel-erfgoedinstellingen aan een grootschalig digitaliseringsproject van kranten uit de periode 1914-1918. Het project werd ondersteund door een stuurgroep waarvan ook medewerkers van FARO en PACKED lid waren.


Referentie
Titel De digitalisering van Belgische frontblaadjes

kranten en tijdschriften uit de Eerste Wereldoorlog (Voorkeurstitel)

Locatie
Uitgever
Jaar van uitgave 2015
Rechten CC-BY-SA
Persistent ID


Auteur(s)

Tuur Van Hove: Projectmedewerker Digitalisering (VIAA - Vlaamse Erfgoedbibliotheek)

Abstract

Onder de projectnaam Nieuws van de Groote Oorlog begon het Vlaams Instituut voor Archivering (VIAA) samen met de Vlaamse Erfgoedbibliotheek,FARO,PACKED en dertien cultureel-erfgoedinstellingen aan een grootschalig digitaliseringsproject van kranten uit de periode 1914-1918. Het project werd ondersteund door een stuurgroep waarvan ook medewerkers van FARO en PACKED lid waren.

Nadat de periodieke publicaties uit de periode 1914-1918 bij die dertien instellingen in kaart werden gebracht, werd op basis hiervan een selectielijst voor digitalisering opgesteld. Die lijst diende als basis voor het lastenboek dat werd opgesteld als Europese aanbesteding voor het digitaliseringsproject. Na jurering waarbij zowel met de prijs als de kwaliteit werd rekening gehouden, kwam GMS als digitaliseringsfirma uit de bus voor het uitvoeren van het project.

De planning van het project ziet er als volgt uit:

  1. Fase 1: inventarisatie en materiaalanalyse (augustus 2013-januari 2014): VIAA (Brecht Declercq) coördineert het project en de Vlaamse Erfgoedbibliotheek (Tuur Van Hove) voert het project uit.
  2. Fase 2: registratie, verpakking en digitalisering (februari 2014-februari 2015): VIAA (Brecht Declercq) superviseert het project en de Vlaamse Erfgoedbibliotheek (Tuur Van Hove) coördineert het project. De partners registreren de dragers en verpakken ze. GMS transporteert en digitaliseert de dragers.
  3. Fase 3: ontsluiting en interactie (maart 2015 e.v.): de digitale bestanden en OCR-bestanden worden via de publiekswebsite van VIAA en bestaande websites ontsloten.

Status

  • Op 10 juni 2014 werd een hoeveelheid testmateriaal uit het ADVN bij de digitaliseringsfirma GMS afgeleverd. Dit materiaal werd ingescand volgens de kwaliteitseisen vastgelegd in het lastenboek. Er werden ook afgeleide bestanden en OCR-bestanden gemaakt.
  • Sinds begin juli 2014 zijn de eerste partners van het Nieuws van de Groote Oorlog project begonnen met het registreren, barcoderen en verpakken van hun materiaal zodat er eind juli een eerste batch te digitaliseren materiaal door GMS kon worden opgehaald bij volgende partners. In totaal omvat de eerste batch 6.001 nummers en 39.916 pagina’s:
    • AMSAB: 486 nummers: 2.485 pagina’s
    • In Flanders Fields Museum: 4.260 nummers: 23.115 pagina’s
    • Letterenhuis: 35 nummers: 228 pagina’s
    • Memorial Museum Passchendaele 1917: 877 nummers: 8.955 pagina’s
    • Provinciale Bibliotheek Tolhuis: 343 nummers: 5.133 pagina’s
  • Het ophalen van de tweede batch van 4.835 nummers en 20.124 pagina’s werd begin september 2014 voorzien bij volgende partners:
    • ADVN: 4.562 nummers: 18.612 pagina’s
    • Liberaal Archief: 273 nummers: 1.512 pagina’s
  • Na een intense kwaliteitscontrole van enkele maanden - zowel behulp van Adobe Photoshop als gespecialiseerde software als ImCheck en iQ Analyzer - van de moederbestanden en de OCR-bestanden door de Vlaamse Erfgoedbibliotheek (Tuur Van Hove) en PACKED (Rony Vissers) en het afstemmen van de kwaliteitsworkflow met de digitaliseringsfirma GMS, werd er begin oktober 2014 een akkoord gegeven worden voor de start van de effectieve digitalisering van frontbladen, kranten en tijdschriften door GMS. Op 9 oktober 2014 werden de eerste kranten gedigitaliseerd.
  • Een derde batch met 13.524 nummers en 75.843 pagina's werd begin december 2014 bij deze partners opgehaald:
    • AMVB: 864 nummers: 5.773 pagina's
    • KADOC: 944 nummers: 9.968 pagina's
    • KULeuven: 11.510 nummers: 59.071 pagina's
    • Provinciale Bibliotheek Limburg: 206 nummers: 1.031 pagina's
  • Een vierde batch werd eind januari en begin februari 2015 opgehaald bij:
    • Erfgoedbibliotheek Hendrik Conscience: 14.940 nummers en 68.862 pagina's
  • De vijfde en laatste batch werd half januari en eind februari 2015 opgehaald bij
    • UGent: 13.041 nummers en 65.646 pagina's.

Probleemstelling

N.a.v. de herdenking van de Groote Oorlog is er een hernieuwde belangstelling voor frontbladen, kranten, tijdschriften, pamfletten en vlugschriften uit deze periode. Deze nieuwsbladen vormen een belangrijke bron voor de geschiedenis van het leven in België tijdens de Eerste Wereldoorlog. Toch zijn ze amper gekend bij het publiek en meestal alleen op papier of microfilm toegankelijk voor onderzoekers.

Publicaties uit deze periode (en zeker de kranten) zijn bedreigd door de vaak gebrekkige kwaliteit van het papier waarop ze gedrukt zijn. Digitalisering is dus absoluut noodzakelijk om de inhoud van deze documenten voor de toekomst te bewaren én toegankelijk te houden.

Op vraag van VIAA schreven de Vlaamse Erfgoedbibliotheek, FARO en PACKED een projectvoorstel uit voor een digitaliseringsproject van frontblaadjes, kranten en tijdschriften uit België en over België voor de periode van de Eerste Wereldoorlog, die worden bewaard in uiteenlopende Vlaamse erfgoedinstellingen. Het project is daarom een samenwerking met de volgende partners: Erfgoedbibliotheek Hendrik Conscience, de Universiteitsbibliotheken van Gent en Leuven, de Provinciale Bibliotheek Limburg, de Provinciale Bibliotheek Tolhuis, de archiefinstellingen ADVN, Amsab-ISG, AMVB, KADOC en het Liberaal Archief, het Letterenhuis, het museum In Flanders Fields en het Memorial Museum Passchendaele 1917.

Frontbladen zijn een duidelijk te onderscheiden genre dat als dusdanig kan worden gecontextualiseerd en onderzocht. Door deze relatief onbekende en ongebruikte bronnen voor een breder publiek te ontsluiten kunnen we iets toevoegen aan het verhaal van de 'Groote Oorlog'. Frontbladen zijn over heel Vlaanderen uitgegeven. Dit maakt hen interessant voor een ruim publiek. Dit geldt bij uitbreiding ook voor andere oorlogskranten en bladen (clandestiene of gecensureerde pers in bezet gebied), pamfletten of vlugschriften (ook wel vliegende bladen genoemd).

Naast de publiekswaarde zijn er nog andere elementen die pleiten voor de digitalisering van kranten en (front)bladen:

  • materiële kwetsbaarheid (ongeveer 15% is in zeer slechte staat, ongeveer 25% in eerder slechte staat). Door de geleidelijke verzuring dreigt een groot deel van de collectie snel onbruikbaar te worden;
  • uniciteit (weinig overlap, veel uniek materiaal in vergelijking met hedendaagse publicaties);
  • onderzoeksbelang/historische waarde of relevantie in de context van de herdenking van Wereldoorlog I;
  • mogelijkheid om volledige samenhangende collecties ‘oorlogspers’ exhaustief te digitaliseren (beheersbare aantallen).

Methode

Samenwerkingsverband

Documentair erfgoed uit Wereldoorlog I is verspreid over vele erfgoedbibliotheken, archieven en musea. Het project is daarom een samenwerking tussen het VIAA, de Vlaamse Erfgoedbibliotheek, FARO, PACKED (stuurgroep), de Erfgoedbibliotheek Hendrik Conscience, de Universiteitsbibliotheken van Gent en Leuven, de Provinciale Bibliotheek Limburg en Tolhuis, de archiefinstellingen ADVN, Amsab, AMVB, KADOC en het Liberaal Archief, het Letterenhuis, het In Flanders Fields Museum en het Memorial Museum Passchendaele 1917 (partnerinstellingen). De betrokken archieven, bibliotheken en musea hebben zeer rijke krantencollecties, met soms vele duizenden nummers.

Naast de samenwerking met bovenstaande partners werd ook een samenwerking met CEGESOMA bekomen. Het project The Belgian War Press van CEGESOMA werd geformuleerd en uitgevoerd binnen de eerste fase van de federale digitalisatie:

  • Reikwijdte: vooral de clandestiene, maar ook gedeeltelijk de gecensureerde dagbladpers, ongeacht waar ze bewaard werden (instellingen over heel België): pluspunt was de creatie van een geïntegreerde, nieuwe digitale collectie, vollediger dan ooit tevoren. Met in het begin een publieksgerichte finaliteit: database en website als onderzoeksinstrument: The Belgian War Press.
  • Timing: bedoeling is om het laatste gedeelte online te hebben voor de zomer van 2014.
  • Technisch: clandestiene pers is allemaal in kleur gebeurd, de gecensureerde niet. Het digitalisatiebedrijf was Infotechnique, nu Numen. Alles is ge-OCR’d ( =optical character recognition).

Door de samenwerking tussen de projecten The Belgian War Press en Nieuws van de Groote Oorlog wordt dubbel digitaliseringswerk vermeden en wordt een toegang gecreëerd tot een veel grotere collectie die inhoudelijk duidelijk bij elkaar hoort. VIAA streeft niet naar een overdracht, maar naar een licentie: materiaal gedigitaliseerd door CEGESOMA wordt toegankelijk via het VIAA-platform, materiaal gedigitaliseerd door VIAA wordt toegankelijk via het CEGESOMA-platform. De herkomst van het materiaal zou er dan als volgt uitzien:

samenwerking CEGESOMA - VIAA

Fase 1: inventarisatie en materiaalanalyse

In augustus 2013 stelde VIAA de nodige budgetten ter beschikking voor de uitvoering van het Nieuws van de Groote Oorlog project en vroeg aan de Vlaamse Erfgoedbibliotheek om een ondersteunende en begeleidende rol op te nemen. Eva Wuyts en David Coppoolse zetten hun expertise op vlak van erfgoedbibliotheken en digitalisering(sprojecten) in en Tuur Van Hove werd als nieuwe (tijdelijke) projectmedewerker digitalisering aangetrokken om aanvankelijk de eerste fase (inventarisatie en materiaalanalyse) van het project uit te voeren.

Vertrekkend van Abraham - Catalogus van Belgische Kranten voerde Tuur in de bewaarinstellingen een analyse uit van het te digitaliseren materiaal. Daarbij werd de voorlopige lijst verder gedetailleerd. Per reeks bepaalde hij een aantal fysieke parameters, zoals de volledigheid van de reeks, het aantal beschikbare edities, de omvang in pagina's, de paginagrootte, ... Ook problemen met de staat van het papier, de verpakking, de hanteerbaarheid en de (machine)leesbaarheid werden geregistreerd.

Het materiaal bleek zeer divers te zijn. Het omvat frontblaadjes, kranten (clandestien en gecensureerd) en tijdschriften. Er zijn Nederlandstalige, Franstalige en soms ook Engels- of Duitstalige publicaties, soms twee- of meertalig binnen een titel. Ze zijn los, ingebonden of gebundeld in fardes en er zijn heel kleine (< A5) tot heel grote (A1) formaten. Sommige frontblaadjes zijn handgeschreven, andere getypt of gedrukt. Het papier kampt vaak met verzuring en allerhande vormen van beschadiging zoals vouwen, vlekken, scheuren en afbrokkelende randen.

Oorspronkelijk was steekproefgewijs uitgegaan van 90.000 te digitaliseren pagina’s. Bij het einde van de eerste fase stond de teller op een kleine 450.000 pagina's. Om dubbele digitalisering te vermijden werd de overlap tussen de collecties en andere digitaliseringsinitiatieven bepaald, waardoor er uiteindelijk ongeveer 280.000 te digitaliseren pagina's overbleven.

Op basis van de voltooide materiaalanalyse werd begin 2014 een selectielijst opgesteld van te digitaliseren titels. De definitieve lijst werd opgenomen in het lastenboek waarmee VIAA de digitalisering uitbesteedde aan de digitaliseringsfirma GMS.

Fase 2: registratie, verpakking en digitalisering

In een tweede fase (juni 2014-februari 2015) starten de partners met het registreren van hun WOI-collectie in het registratiesysteem AMS, krijgen de verschillende nummers een barcode: voor losse nummers op een zuurvrije farde en voor gebonden nummers op zuurvrije schutbladen per nummer. Daarna worden ze verpakt in dozen zodat alles transportklaar is voor de digitaliseringsfirma. Zowel de zuurvrije fardes als de dozen komen in drie formaten:

  • SMALL: formaten kleiner of gelijk aan A5;
  • MEDIUM: formaten groter dan A5 en kleiner of gelijk aan A4 en A3;
  • LARGE: formaten groter dan A3 en kleiner of gelijk aan A2 en A1.

Na ophaling door de digitaliseringsfirma gaat de effectieve digitalisering van start. Daarna worden de bestanden opgenomen in de archiefomgeving van VIAA en ter beschikking gesteld van de bewaarinstellingen. De originele materialen keren na digitalisering terug naar de bewaarinstellingen.

De werkwijze wordt door deze afbeelding en onderstaand filmpje geïllustreerd:

workflow registratie

De registratiehandleiding is ook online beschikbaar voor de partners:

Fase 3: ontsluiting en interactie

De derde fase (maart 2015 e.v.) is de uiteindelijke ontsluiting van het gedigitaliseerde materiaal via de VIAA-publiekswebsite en later ook bestaande websites als Abraham, The Belgian War Press, Flandrica, Europeana en andere kanalen zoals bijvoorbeeld educatieve websites, onderwijspakketten en thematische dossiers op de websites van mediagroepen, kranten en de openbare omroep.

Het materiaal is rechtenvrij en zal als Open Data ter beschikking worden gesteld. De gedigitaliseerde bestanden zullen in JPEG2000-formaat op de VIAA-publiekswebsite worden ontsloten. Uiteraard blijven de TIFF-moederbestanden beschikbaar in het VIAA-archiefsysteem.

Via de website zal er full text gezocht kunnen worden op woorden die voorkomen in de frontblaadjes, kranten en tijdschriften. Dit omwille van het feit dat het materiaal ook via OCR wordt ontsloten.

Resultaten

Belangrijkste uitdagingen

Tijdens Fase 1 werden de frontbladen, kranten en tijdschriften op titelniveau door de projectmedewerker digitalisering geregistreerd.

Tijdens Fase 2 moest AMS - het registratiesysteem van VIAA - dat tot voordien enkel voor audiovisueel materiaal werd gebruikt, voor papieren dragers worden aangepast. Het bleek tevens noodzakelijk de registratie in AMS op nummerniveau door te voeren zodat elk nummer een Persistent Identifier (PID) kon krijgen. Dit was zowel van belang voor de digitaliseringsfirma zodat ze wist welke nummers ze diende te digitaliseren als voor VIAA voor de ingest in het MAM-archiefsysteem en de latere ontsluiting via de website.

Het van titel naar nummerniveau brengen van de registratie zorgde voor een aantal onvoorziene elementen:

  • Workload: extra workload bij de partners, voornamelijk die met de grootste collecties. Bijvoorbeeld Erfgoedbibliotheek Hendrik Conscience moest in plaats van 294 titels 18.222 nummers registreren.
  • Verpakkingsmateriaal en barcodes: bij de berekening van het verpakkingsmateriaal en de barcodes bleek het geen sinecure om de aantallen van titel- naar nummerniveau te brengen. De reden hiervoor was dat het exacte aantal nummers per titel niet altijd gekend was en ook omdat sommige titels zowel losse als ingebonden nummers bevatten. Zelfs met een draaitabel bleek de berekening niet volledig foutloos, met als resultaat dat er te weinig of te veel verpakkingsmateriaal besteld werd en voor enkele partners ook te weinig barcodes.
  • Ingebonden exemplaren: voor de content providers was het logischer om de band als geheel te registreren m.b.v. één barcode en dus ook één record per band, terwijl de digitaliseringsfirma en het archiefsysteem van VIAA registratie op nummerniveau vereiste. Dit vergde extra overredingskracht bij enkele partners en de inzet van bijkomende ondersteuning om deze klus te klaren.

De beperkte tijdsperiode (juli-december 2014) die voorzien werd voor de digitalisering zorgde voor extra tijdsdruk bij zowel de partners als VIAA, de Vlaamse Erfgoedbibliotheek en de digitaliseringsfirma. Hierdoor was het essentieel om de vooropgestelde planning aan te houden en de timing te respecteren. Dit bleek niet evident omwille van boven vermelde onvoorziene elementen.

Daarnaast bleek het ondertekenen van de samenwerkingsovereenkomst met een stedelijke partner omwille van de stedelijke procedures meer tijd in beslag te nemen dan verwacht. Ook de sluiting voor restauratie van het gebouw met de collectie van een andere partner tussen september en december 2014 zorgde ervoor dat die partner pas vanaf november kon beginnen met registreren, barcoderen en verpakken van haar collectie.

Ook het uitwerken van de kwaliteitscontrole workflow en de afstemming hieromtrent met de digitaliseringsfirma nam extra tijd in beslag waardoor de effectieve digitalisering pas op 9 oktober 2014 van start kon gaan.

Door al deze elementen werd beslist om de tijdsperiode voor digitalisering te verlengen tot half maart 2015.

Belangrijkste resultaten

De belangrijkste resultaten zijn:

  • digitalisering van en realisatie van toegang tot waardevol en kwetsbaar materiaal;
  • opbouw van kennis en expertise m.b.t. het digitaliseren van kranten en tijdschriften;
  • samenwerking met verschillende partners uitbouwen;
  • creatie van een "sjabloon" voor een offerte van digitaliseringsprojecten voor papieren erfgoed;
  • creatie van een workflow voor digitaliseringsprojecten voor papieren erfgoed;
  • creatie van een workflow voor kwaliteitscontrole van bestanden die het resultaat zijn van digitaliseringsprojecten voor papieren erfgoed;
  • toevoeging van 185 titels aan Abraham - Catalogus van Belgische Kranten.

Lessons learned

Uit het project konden een aantal waardevolle lessen worden getrokken voor toekomstige, gelijkaardige projecten.

Tender:

  • Opnemen van targets beter specifiëren: hoeveel, wanneer, ...

Algemeen:

  • Begin lang op voorhand: neem ruim de tijd voor het in kaart brengen en inventariseren van het materiaal, het opzetten van de samenwerking met de partners, het opstellen van een gedragen workflow, het maken van concrete afspraken, ...

Samenwerking partners:

  • Voorzie voldoende tijd voor het goedkeuren van een samenwerkingsovereenkomst met stedelijke partners. Hun procedures nemen veel tijd in beslag. Gezien de enorm lange doorlooptijd van samenwerkingsovereenkomsten: zeer vroeg hiermee starten!
  • Content partners nog beter voorbereiden op het grote werk van de registratie. Maak duidelijke afspraken over de registratie, barcodering en verpakking en werk in deze context ook aan het groepsgevoel bij alle betrokken instellingen.
  • Communicatie en informatiedoorstroming is heel belangrijk: creëer betrokkenheid en zorg dat de dialoog met en tussen de partners op gang blijft.

Tips & Tricks

Wil je zelf een digitaliseringsproject van periodieke publicaties opstarten, hou dan rekening met volgende tips & tricks:

  • Start tijdig met het project: neem voldoende tijd om:
  • scope, timing en budget scherp te stellen;
  • het te digitaliseren materiaal grondig in kaart te brengen;
  • samenwerking(sovereenkomsten) met partners op te zetten;
  • de workflow samen met de partners te bepalen;
  • concrete afspraken te maken: wie doet wat tegen wanneer.
  • Zorg voor een goed uitgewerkte en gedetailleerde tender waarin alle technische aspecten en kwaliteitsnormen staan opgelijst.
  • Zorg voor een goede communicatie en informatiedoorstroming met de partners:
  • dit stimuleert betrokkenheid;
  • hierdoor ontstaat er een dialoog en wederzijdse betrokkenheid.
  • Zorg dat alle aspecten van het project voldoende zijn onderbouwd, overlegd en uitgewerkt:
  • dit geldt zowel voor de voorbereiding, de uitvoering en de nabewerking als voor evaluatie van het project;
  • zorg voor goed uitgewerkte workflows en afspraken doorheen alle fasen van het project.
  • Wanneer er tijdens het project zaken moeten worden bijgestuurd of aangepast, overleg dit dan met de partners en zorg dat zij ook hun input kunnen leveren.

Bronnen

Links naar externe bronnen:

Links naar gebruikte richtlijnen:

Contactgegevens