Publicatie:Contested Content

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen


Samenvatting

Met het voor CAVA eerste grote digitaliseringsproject ‘Contested Content’ hebben we tot doel om een deel van onze tijdschriftencollectie te vervolledigen, te digitaliseren, breder doorzoekbaar te maken en onder de aandacht te brengen. De focus in het kader van dit project ligt op de tijdschriften van de centrale organen van de vrijzinnigheid, die een debatcultuur weerspiegelen en niet zelden strijdvaardige maatschappelijke standpunten weergeven; vandaar de titel ‘Contested content’.

Het project is nog niet ten volle afgerond. We werkten met twee geldschieters, waardoor het project doorloopt tot 31 december 2020. We doorliepen, geheel of gedeeltelijk, zo goed als alle stappen van het digitaliseringsproces: het opstellen van een lastenboek, het doorlopen van een gunningsprocedure, het opvolgen en de controle van de eigenlijke digitalisering en het opstellen van een XSD voor de aanmaak van METS-bestanden.

Naast deze stappen, die behoren tot de eigenlijke digitalisering, zorgden we voor een kwalitatieve verbetering van de beschrijvende metadata van onze hele tijdschriftencollectie en zetten we onze eerste stappen in het ontwikkelen van een platform voor de terbeschikkingstelling van de tijdschriften (met IIIF-viewer). Verder boeken we met dit project heel wat vooruitgang met betrekking tot onze aanwezigheid op Wikidata en pakken we de rechtenproblematiek op het vlak van auteursrecht en de privacywetgeving ten gronde aan.


Referentie
Titel Digitaliseringsproject ‘Contested Content’ (vrijzinnige tijdschriften) (Voorkeurstitel)
Locatie
Uitgever
Jaar van uitgave 2020
Rechten CC-BY-SA
Persistent ID


Auteur

Elise Dewilde en Ellen Soetens

Probleemstelling

CAVA, het Centrum voor Academische en Vrijzinnige Archieven, verzamelt, bewaart en beheert het erfgoed en het archief van de Vrije Universiteit Brussel én dat van de vrijzinnig-humanistische gemeenschap in Vlaanderen en Brussel.

Eén van zijn taken is het stimuleren van het onderzoek naar de geschiedenis van het vrijzinnig humanisme. In dat opzicht is zijn collectie tijdschriften van groot belang, gezien het een soort ingang op de vrijzinnige archieven vormt. De digitalisering en het doorzoekbaar maken van deze tijdschriften zou dus een grote stap vooruit betekenen om meer inzicht te kunnen verwerven in de mentaliteit van de vrijzinnig-humanistische gemeenschap, de thema’s die haar interesse reflecteren, het beleid van vrijzinnige organisaties enz.

Om deze collectie - vaak met ‘strijdvaardige’ inhoud - doorzoekbaar te maken, ter beschikking te kunnen stellen en onder de aandacht te kunnen brengen, startte CAVA het project ‘Contested Content’ op en dit naar aanleiding van de impulssubsidies ‘digitale collectieregistratie’ van het departement Kunsten en Erfgoed van de Vlaamse overheid.

CAVA koos ervoor om te starten met de tijdschriften uitgegeven door – om het in erfgoedtermen te zeggen – landelijke organisaties binnen de vrijzinnig-humanistische gemeenschap, zoals: het representatief orgaan voor vrijzinnig Vlaanderen en Nederlandstalig Brussel (de Mens.nu/ Unie Vrijzinnige Verenigingen), sociaal-culturele organisaties binnen de vrijzinnig-humanistische gemeenschap (koepelorganisaties, werkend rond conflicten, radio- en televisie, literatuur en bibliotheken), vrijzinnige verenigingen zoals de organisatie voor morele bijstand aan gevangenen, organisaties voor jongeren en kinderen (bv. m.b.t. zedenleer) enz. Het gaat om meer dan 5500 tijdschriftnummers, daterend van 1946 tot nu, vaak van levensbeschouwelijke aard, die we wilden digitaliseren volgens de richtlijn Metamorfoze Light.

Het project valt uiteen in drie werven, in wisselwerking met elkaar: de digitalisering zelf (opstellen van lastenboek, gunning, voorbereiding, digitalisering zelf (incl. controle)), de terbeschikkingstelling (rechtenproblematiek, open data en het terbeschikkingstellingplatform) en het toeleiden naar de gedigitaliseerde content. Het project is nog niet afgerond, maar we lichten hieronder het verloop, de conclusies en ondernomen acties tot 31 oktober toe. We menen dat dit nuttig kan zijn voor anderen die een gelijkaardig project willen opstarten, bv. qua tijdsinvestering en de punten waarmee rekening gehouden moet worden. Voor de meer technische zaken zullen we in de nabije toekomst ook linken naar documenten zoals het lastenboek en de procedure voor de controle van de resultaten van de digitalisering, toevoegen. We zullen de pagina gaandeweg verder aanvullen.

Status en methode

De digitalisering

Op verkenning

In aanloop naar de aanvraag in het kader van de oproep ‘digitale collectieregistratie’ werden voor alle tijdschrifttitels volgende gegevens opgelijst: het aantal nummers, het aantal bladzijden en een aanduiding of het om recto of recto verso ging om zo het totaal aantal bladzijden te kunnen inschatten. Verder hebben we in de lijst ook de afmetingen opgenomen en aangegeven of het om tijdschriften in kleur ging, hoe het tijdschrift gebonden was en wat de fysieke staat was. Aan de hand van deze gegevens werden prijsindicaties gevraagd bij een aantal digitaliseringsfirma’s.

Eens de aanvraag voor subsidies toegekend was, was het wat zoeken. We organiseerden een aantal informele gesprekken met vertegenwoordigers van digitaliseringsfirma’s waardoor we een eerste indicatie kregen van de aanpak (bv. het werken met barcodes) en we namen literatuur door. We zijn toen gestart met het opstellen van een lastenboek, onder meer aan de hand van het modellastenboek van het expertisecentrum eDAVID.

Een eerste uitdaging: het lastenboek, de gunning en de voorbereiding

In samenspraak met Meemoo kwamen we tot een definitief lastenboek. Dit proces nam enkele maanden in beslag. Nieuwe versies van het lastenboek werden aangemaakt, nagelezen en bijgestuurd naar aanleiding van feedback – soms meermaals – van verschillende personen, intern en extern, met vooral technisch, maar ook juridisch advies (bv. wat betreft de gunningsprocedure).

Een belangrijke problematiek was die van de bestandsnamen. Welke bestandsnamen moeten de bestanden krijgen, door wie zullen die toegekend worden en welke stappen dienen we daarvoor te ondernemen? Uit de verkennende gesprekken bleek dat er drie mogelijkheden waren. Ofwel kent de digitaliseringsfirma betekenisloze bestandsnamen toe en worden de beschrijvende metadata daar achteraf door CAVA aan gekoppeld. Dit brengt echter veel werk met zich mee en bemoeilijkt de controle op de volledigheid. Een tweede mogelijkheid bestaat erin dat de digitaliseringsfirma zelf betekenisvolle bestandsnamen toekent, met als gevolg dat de factuur veel hoger wordt. CAVA koos voor de derde en laatste optie waarbij de digitaliseringsfirma betekenisvolle bestandsnamen toekent op basis van de door CAVA aangeleverde inventaris. Dit gebeurt aan de hand van barcodes.

Bij CAVA stelde zich echter het probleem dat de tijdschriftnummers in het verleden in tekstvelden in ons beschrijvingssysteem Pallas werden opgelijst. CAVA overwoog aanvankelijk om die gegevens te exporteren, maar koos er uiteindelijk voor om met een schone lei te beginnen en de nummers één per één opnieuw op te lijsten in een spreadsheet. Volgende gegevens werd opgelijst voor aanlevering aan de digitaliseringsfirma: titel, subtitel, plaats van uitgave, verantwoordelijke uitgever en uitgevende organisatie, ISSN, datum, jaargang en werkelijk nummer en taal. Op basis daarvan werden de bestandsnamen aangemaakt onder volgende vorm ‘CAVA_TS_XXXX_XXXX_XXXX’, waarbij TS staat voor tijdschriften, gevolgd door het ISSN-nummer en een fictief volgnummer. Dat fictief volgnummer geeft de plaats van een nummer binnen een tijdschrifttitel aan. Dat was noodzakelijk, gezien het feit dat niet alle tijdschriften door de uitgever genummerd waren. CAVA maakte ook gebruik van fictieve ISSN-nummers, daar waar er geen reële voorhanden waren. De csv werd uiteindelijk ook aangevuld met de nodige velden uit de METSRights, een extensie op de METS-standaard.

Met het oog op de bewaring in het digitaal depot, namen we in het lastenboek ook de aanmaak van METS-bestanden op. METS is een XML-standaard die het mogelijk maakt verschillende types metadata op één plaats op te slaan. Meemoo gaf ons het advies naast ALTO (OCR), ook de MIX- (technische metadata) en MODS- (bibliografische beschrijving) standaarden te implementeren. Aanvankelijk waren we niet van plan om voor ALTO te opteren, maar tijdens de verkennende gesprekken bleek dat dit geen meerprijs met zich mee zou brengen. Een medewerker van CAVA verdiepte zich in deze materie en stelde zelf een XSD (een structuur die als leidraad voor de firma moet dienen bij de aanmaak van de bestanden en waartegen de door de firma aangemaakte METS-bestanden gevalideerd kunnen worden) op.

Ook de gunning liep niet van een leien dakje en nam ongeveer drie maanden in beslag. We verstuurden het bestek naar vier firma’s, waarvan er slechts twee een offerte indienden. De twee offertes liepen bovendien qua prijs en inhoud sterk uiteen. Uiteindelijk startte CAVA, met advies van Meemoo, een onderhandelingsprocedure op om het mogelijk te maken om beide offertes met elkaar te vergelijken. In de praktijk werden er bijkomende vragenlijsten bezorgd. CAVA ondernam ook deze stap met het nodige advies op juridisch vlak (juridische dienst van de VUB).

De inventaris werd vervolgens opgestuurd naar de digitaliseringsfirma, waarna we de barcodes ontvingen en we met de barcodering konden starten. Tijdens die voorbereiding hadden we ook oog voor het verwijderen van adresetiketten met persoonsgegevens, het doorbladerbaar maken van tijdschriften (snijden of nietjes verwijderen), het verwijderen of op de juiste plaats toevoegen van bijlagen en het oplijsten van schade.

De digitalisering zelf

In de voorbereidende fase stelde CAVA ook een procedure op om de resultaten van de digitalisering te kunnen evalueren.

In het lastenboek namen we de vereiste op dat het digitaliseringsproces voorafgaandelijk aan de eigenlijke digitalisering gevalideerd moest worden aan de hand van een testpakket waarvoor de gehele procedure succesvol moest worden doorlopen.

We vroegen de firma ook om tijdens de digitalisering de volgens Metamorfoze verplichte dagtargets te bezorgen. Op die manier kan er ook tijdens de digitalisering enige controle uitgeoefend worden. Die controle brengt dagelijks een kleine tijdsinvestering met zich mee.

Een vlotte communicatie bleek tijdens het opvolgingsproces onontbeerlijk om het tijdspad te bewaken. De processen verliepen in de praktijk niet altijd volgens de voorziene planning.

Tot slot moeten er op het einde van de rit ook uitgebreide controles plaatsvinden.

De terbeschikkingstelling

De rechtenproblematiek: auteursrecht en privacy

Hoe kunnen we die vrijzinnige tijdschriften uit de periode 1946 tot heden ter beschikking stellen? Het gaat immers om relatief recente tijdschriften die vaak ‘bijzondere categorieën van persoonsgegevens’ (levensbeschouwelijke opvattingen) bevatten en waarop het auteursrecht nog ten volle rust. CAVA schakelde hiervoor het advies van een advocaat in. De uiteindelijke conclusie was dat we de tijdschriften ter beschikking kunnen stellen op een online platform, mits authenticatie door de gebruiker, en andere, afhankelijk van de persoonsgegevens, eventueel slechts in de leeszaal. CAVA stelde voor die authenticatie reeds een aanvraagformulier op.

Op het vlak van auteursrecht kan CAVA, als dienst van de Vrije Universiteit Brussel (instelling van onderwijs en onderzoek daartoe officieel erkend door de overheid) beroep doen art. XI.191/1, §1, 4° uit het Wetboek van Economisch Recht. Daarin wordt gesteld dat we de tijdschriften, in het kader van de normale activiteiten van de instelling (en dus geenszins met het maken van winst voor ogen), kunnen mededelen ter illustratie bij onderwijs of voor wetenschappelijk onderzoek. De toegang tot het platform dient daarbij wel beveiligd te worden; er moet dus controle uitgeoefend kunnen worden op de toegang tot het platform. Daarenboven moet de gebruiker voor een correcte bronvermelding zorgen. Op die manier hoeven de auteursrechten dus niet per se geklaard te worden, hetgeen eigenlijk een onbegonnen werk zou zijn geweest, gezien de veelheid aan tijdschriften en actoren die verantwoordelijk waren voor de inhoud (auteurs, cartoonisten, fotografen enz.).

Op het vlak van persoonsgegevens kan CAVA, om de tijdschriften online ter beschikking te stellen, weliswaar mits authenticatie, zich beroepen op de artikels 207 en 208 uit de Wet betreffende de bescherming van natuurlijke personen met betrekking tot de verwerking van persoonsgegevens van 30 juli 2018, indien het centrum de verwerking doet met het oog op archivering in het algemeen belang, het wetenschappelijk of historisch onderzoek of statistische doeleinden.

Daarvoor moet men wel aan één van volgende voorwaarden voldoen: de betrokkene heeft zijn toestemming verleend, de gegevens zijn door de betrokkene zelf openbaar gemaakt, de gegevens hangen nauw samen met het openbare of historische karakter van de betrokkene of de gegevens hangen nauw samen met het openbare of historische karakter van feiten waarbij de betrokkene betrokken was. Een analyse van de aard van de tijdschriften drong zich dus op.

Men zou kunnen redeneren dat de betrokkene zijn toestemming heeft verleend of dat de gegevens door de betrokkene zelf zijn openbaar gemaakt, omdat ze in een tijdschrift zijn gepubliceerd, maar dit wordt geïnterpreteerd als passieve en niet als actieve openbaarmaking.

In de praktijk betekent dit dat we voor die tijdschriften die bijzondere categorieën van persoonsgegevens bevatten aan de hand van steekproeven in de eerste plaats een inschatting maken van de toenmalige publieke verspreiding van de tijdschriften (voorwaarde 1 en 2). Dit doen we bijvoorbeeld door te kijken naar de doelgroep en de oplage. We gaan ervan uit dat hoe ruimer de doelgroep, de oplage enz. aanvankelijk waren, hoe kleiner de kans is dat de betrokkene niet instemde met de verspreiding van zijn persoonsgegevens. Een tijdschrift met een grote oplage dat gratis verspreid wordt, is van een andere aard dan een kaderblad, dat intern binnen een organisatie circuleert. We delen de tijdschriften daarom in in 3 categorieën: de tijdschriften met een grote doelgroep en grote verspreiding (bv. voor de brede vrijzinnig-humanistische gemeenschap), de tijdschriften met een beperkte doelgroep en een beperkte verspreiding (bv. beroepsgroep) en de tijdschriften bedoeld voor een zeer beperkte doelgroep, met een zeer beperkte verspreiding (bv. intern binnen een organisatie). In het eerste geval kunnen we zonder verdere stappen de beslissing nemen dat de tijdschriften ter beschikking mogen worden gesteld op het online platform met authenticatie.

In de twee andere gevallen zullen we nagaan in welke mate de gegevens in de tijdschriften nauw samenhangen met het openbare of historische karakter van de betrokkene of van de feiten waarbij de betrokkene betrokken was (voorwaarde 3 en 4). In grote lijnen zullen we nagaan of er in meer of mindere mate gegevens van personen terug te vinden zijn in de tijdschriften waarvan het niet algemeen bekend is dat ze aansluiting vinden bij het vrijzinnig-humanisme. Indien er bijvoorbeeld enkel personen aan bod komen waarvan bekend is dat ze aansluiting vinden bij het vrijzinnig-humanisme (vb. mensen die bestuursfuncties opnamen in vrijzinnige organisaties), kunnen we opteren om de tijdschriften ter beschikking te stellen via authenticatie. Indien er doorgaans minder publieke figuren aan bod komen in de tijdschriften, zal dit voor CAVA een reden zijn om de tijdschriften enkel ter beschikking te stellen in de leeszaal, zodat de gebruiker de gegevens enkel op handgeschreven wijze kan reproduceren en we hier ook controle op kunnen uitoefenen (Art. 9 Algemene verordening gegevensbescherming).

Daarnaast diende CAVA nog een aantal acties te ondernemen. Zo moet CAVA de verantwoordelijken voor de oorspronkelijke verwerking, in dit geval de verantwoordelijke uitgevers, informeren over de gegevensverzameling. Het centrum dient echter geen contracten met hen af te sluiten (art. 194). Gezien de verantwoordelijke uitgevers van de tijdschriften regelmatig veranderen, dienen er dus redelijk veel mensen op de hoogte gebracht te worden van het project en daarvoor is er nood aan actuele contactgegevens. Om deze op te sporen, ging CAVA een samenwerking aan met deMens.nu. We grepen daarbij ook de kans om te polsen naar mogelijke aanvullingen op onze tijdschriftencollectie.

Uiteraard dient CAVA ook te beschikken over een DPO en dient CAVA te zorgen voor een verantwoording in het register van verwerkingsactiviteiten. Gezien CAVA deel uitmaakt van de rechtspersoon VUB en tegelijkertijd de roepnaam is voor het samenwerkingsverband tussen het Universiteitsarchief van de VUB en het Centrum voor Vrijzinnig Humanistisch Erfgoed (CVHE vzw), dient CAVA ervoor te zorgen dat dit voor beide ‘takken’ in orde is. Door de advocaat werd ook aangeraden om de respectieve verantwoordelijkheden van respectievelijk CVHE vzw (Centrum voor Vrijzinnig Humanistisch Erfgoed vzw) en de Vrije Universiteit Brussel met betrekking tot de verplichtingen die de GDPR-wetgeving oplegt, vast te leggen. We gaan er in dat verband van uit dat CVHE vzw en VUB gezamenlijke verwerkingsverantwoordelijken zijn. In dat verband hernieuwde CAVA reeds zijn privacyverklaring (https://www.cavavub.be/nl/privacyverklaring).

Tot slot raadde de advocaat ook aan om transparant informatie te verschaffen over de redenen waarom CAVA de tijdschriften digitaliseert en ontsluit en de beoogde doeleinden, alsook een duidelijk contactpunt te communiceren waarop auteursrechthebbenden of betrokkenen zich kunnen melden. In dat opzicht werden er gebruiksvoorwaarden voor het platform waarop de tijdschriften ter beschikking gesteld zullen worden, opgesteld.

Op het platform zal ook gewerkt worden met rechtenverklaringen (https://rightsstatements.org/en/).

Open data in Wikidata

Om de metadata van de tijdschriften als linked open data via Wikidata ter beschikking te stellen, moesten de tijdschriften o.a. gekoppeld kunnen worden aan hun uitgevers. De bestaande fiches over de archiefvormers werden daarom geüpdatet en onder impuls van de online vorming ‘opladen naar Wikimedia-platformen’ werd een dataset met vrijzinnige archiefvormers geüpload naar Wikidata (er werden 150+ nieuwe items aangemaakt en 60+ bestaande items aangevuld) via OpenRefine (https://www.wikidata.org/wiki/Special:Contributions/BennyBox).

Met betrekking tot de tijdschriften werd ondertussen, op basis van de gedetailleerde oplijsting, een dataset met een honderdtal (nationale, vrijzinnige) tijdschriften samengesteld. Die zal binnenkort eveneens geüpload worden in Wikidata.

Een platform om de tijdschriften ter beschikking te stellen

De tijdschrifttitels zullen uiteraard teruggevonden kunnen worden via onze catalogus. Vandaar zal de gebruiker kunnen doorklikken naar de eigenlijke beelden en metadata van de afzonderlijke tijdschriftnummers.

Met duurzaamheid en gebruiksvriendelijkheid voor ogen kijkt CAVA nu in de richting van de open source applicatie Omeka S, een webpublicatieplatform met mogelijkheden tot integratie van een IIIF-viewer. Een IIIF-viewer biedt mogelijkheden om de beelden op een gebruiksvriendelijke manier ter beschikking te stellen met bijhorende metadata. Aan de hand van de authentication API kan voldaan worden aan de vereiste van authenticatie in het kader van de rechtenproblematiek. Het platform bevindt zich nu in de ontwikkelingsfase. We zullen de digitale bestanden gefaseerd toevoegen.

Depot

Met behulp van de financiering door deMens.nu in het kader van dit project wordt een digitaal depot opgezet met behulp van twee NAS-systemen (Network Attached Storages), een platformonafhankelijke manier van werken.

CAVA zorgt voor back-ups volgens de 3-2-1 regel: 3 kopieën, op 2 verschillende media, waarbij 1 kopie offsite bewaard wordt. Op elk NAS-systeem zal een volledige kopie van het digitale depot staan en er zullen backups beschikbaar zijn op externe harde schijven die elders bewaard zullen worden.

Daarnaast kijkt CAVA naar de mogelijkheden om een raadplegingsserver (een cloudserver) in te richten. Het terbeschikkingstellingsplatform voor de tijdschriften zal hiermee in verbinding staan.

Conclusies

Een eerste groot digitaliseringsproject is een leerproces en vraagt dus de nodige tijd. Bovendien is het in dat geval ook moeilijker om de tijdsduur van de verschillende fases van het project in te schatten. Het is dus belangrijk om voldoende tijd te voorzien voor het uitwerken van het lastenboek, rekening te houden met tegenslagen bij de gunning en de tests. Ook voor de aanpak van de rechtenproblematiek en het uitwerken van een procedure voor de controle is veel tijd nodig.

Een goed projectmanagement is noodzakelijk en het inzetten van vaste medewerkers, daar waar het kan, komt een duurzame verankering van de opgedane kennis binnen de organisatie zeker ten goede. Samenwerking, netwerking en bijscholing bleken tijdens het proces noodzakelijk. We waren blij beroep te kunnen doen op de externe expertise van Meemoo en zowel de studiedagen als de collegagroepen bevorderden het oplossend denken en gaven ons nieuwe ideeën.

In de praktijk heeft CAVA serieuze stappen vooruit gezet met betrekking tot de kennisverwerving in verband met:

  • het opstellen van een lastenboek en een gunningsprocedure;
  • de technische en praktische kant van een digitaliseringsproces (inclusief kwaliteitscontrole);
  • verschillende XML-standaarden (METS (inclusief METSRights), MODS en MIX) en bijhorende XSD;
  • Omeka S en IIIF;
  • de rechtenproblematiek (privacy- en auteursrecht) m.b.t. het ter beschikking stellen in onze specifieke context;
  • Wikidata.

Literatuur

Contactgegevens

Elise Dewilde, verantwoordelijke voor het digitaliseringsproject (elise.dewilde@cavavub.be)

Ellen Soetens, technisch verantwoordelijke voor het digitaliseringsproject (ellen.maria.soetens@vub.be)

+32 (0) 2 629 24 34