Publicatie:Uittesten van bewaarstrategieën voor DWG-bestanden met 2D-informatie

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen


Samenvatting

Deze gevalstudie beschrijft het traject dat werd doorlopen bij de ontwikkeling van een bewaarstrategie door het CVAa (afdeling van het Vlaams Architectuurinstituut) voor 2D DWG-bestanden uit het archief van ontwerper-architect Maarten Van Severen.

Het onderzoek naar een bewaarstrategie bestond uit:

  1. Oplijsten van de noden van de doelgroepen
  2. Onderzoeken van de context waarin de DWG-bestanden tot stand kwamen
  3. Deskresearch naar de bewaring van DWG-bestanden
  4. Doorlopen van de PLATO Preservation Planning workflow

Dit traject gaf niet alleen inzicht in de preservatie van 2D DWG-bestanden en CAD-bestanden in het algemeen, maar ook in de concrete uitwerking van preservatieplanning, die bij andere trajecten kan worden ingezet.


Referentie
Titel Uittesten van bewaarstrategieën voor DWG-bestanden met 2D-informatie (Voorkeurstitel)
Locatie
Uitgever
[www.vai.be Vlaams Architectuurinstituut]
Jaar van uitgave 2016
Rechten CC-BY-SA
Persistent ID


Auteur(s)

Wim Lowet, archivaris/projectleider van het Centrum Vlaamse Architectuurarchieven (Vlaams Architectuurinstituut)

Status

Cover van het rapport "Bouwstenen voor de archivering van het digitaal archief Maarten Van Severen", verschenen in september 2016

De bevindingen van het onderzoek werden in september 2016 gepubliceerd in een rapport dat na te lezen is op http://www.architectuurarchiefvlaanderen.be/nl/publicatie/rapport-bouwstenen-voor-de-archivering-van-het-digitaal-archief-maarten-van-severen

Het resultaat van dit rapport, een workflow voor de verwerking van een digitaal archief, wordt nu uitgetest op een digitaal archief van het Architectuurarchief van de Provincie Antwerpen.

Probleemstelling

Digitale objecten zijn er niet voor de eeuwigheid. Eén van de belangrijkste en meest problematische bedreigingen is die van obsolescence: Door afwezigheid van geschikte software zijn de objecten niet meer te openen.

Specifiek voor digitale architectuurarchieven stelt zich de uitdaging van de bewaring van CAD-bestanden. CAD-software vormt sinds de jaren ’90 in de meeste Vlaamse architectenbureaus het belangrijkste hulpmiddel voor de uitwerking van bouwtekeningen. De meeste architecten werken in 2D, maar 3D-software – en bijbehorende formaten – komen steeds meer in opmars.

Wie echter op zoek gaat naar publicaties over kant-en-klare bewaarstrategieën voor 2D CAD-bestanden komt van een kale reis thuis. Een tool als Archivematica, die zijn Format Policies online publiceert, vermeldt bijvoorbeeld niets over CAD-bestanden. CAD-bestanden zijn een belangrijk onderdeel van het cultureel erfgoed van het ontwerp van de omgeving. Nu digitale archieven van architecten steeds vaker hun weg vinden naar de archiefinstellingen, dringt een antwoord op de bewaring van CAD-bestanden (in de eerste plaats met 2D-informatie) zich op.

Het CVAa begon deze oefening niet uit het niets. Het had reeds enkele onderzoekstrajecten doorlopen naar de digitale archieven van architecten. De belangrijkste om m.b.t. dit onderwerp te vermelden, is het onderzoek van Henk Vanstappen naar de opname en bewaring van CAD-bestanden uit architectenbureaus dat werd voltooid in 2013. Dit rapport bevat bijzonder bruikbare informatie over de verschillende versies van CAD-software. Daarnaast testte Vanstappen enkele migratietrajecten uit en bracht hij belangrijke problemen in kaart.

Dit onderzoek leverde enkele suggesties m.b.t. archiveringsformaten op, maar nog geen concreet antwoord op valabele en vooral haalbare bewaarstrategieën die een archiefinstelling kon volgen, wanneer deze werd geconfronteerd met 2D CAD-bestanden.

In 2014 startte het CVAa een onderzoek naar het digitaal archief van Maarten Van Severen, met de goedkeuring van The Maarten Van Severen Foundation. Doel van het onderzoek was het uittekenen van een workflow voor de verwerking ervan. Het bureau van Maarten Van Severen maakte voor de aanmaak van zijn technische tekeningen gebruik van het bekende programma AutoCAD, dat tekeningen opslaat in het DWG-formaat. Deze tekeningen werden door het bureau steeds rechtstreeks uitgeprint, zonder omzetting naar PDF, zoals nu meestal gebeurt. De DWG-bestanden waren met andere woorden de enige digitale representatie van de tekeningen.

Om de tekeningen digitaal te bewaren, moest er dus een bewaarstrategie worden ontwikkeld voor de DWG-bestanden. AutoCAD is bovendien marktleider in Vlaanderen voor het maken van architectuurtekeningen, zodat deze oefening het belang van het archief Maarten Van Severen oversteeg.

Het onderzoek naar het Maarten Van Severen-archief werd daarom aangegrepen als een uitstekende gelegenheid om een antwoord te formuleren op de preservatie van 2D DWG-bestanden.

Methodologie

Het bepalen van een bewaarstrategie houdt het beantwoorden van een aantal vragen in:

  • Voor welke groepen worden de DWG-bestanden bewaard? Wat is de essentiële inhoud en wat zijn de essentiële functies die voor deze groepen bewaard moeten worden?
  • Wat is de archivalische context van de DWG-bestanden?
  • Welke bewaarstrategieën worden internationaal toegepast voor de bewaring van DWG-bestanden?
  • Welke bewaarstrategie is de meest adequate?

Onderzoek naar de noden van de doelgroepen

Een onderzoek naar de stakeholder requirements werd ondernomen om de noden inzake authenticiteit, ontsluiting en preservatie te bepalen. Dit gebeurde door een combinatie van desk research en interviews.

Het bleek het eenvoudigst om doelgroepen af te bakenen volgens functionele categorieën. Als doelgroepen van een cultureel architectuur- en vormgevingsarchief werden onderscheiden:

  • De archiefvormer: Organisaties die het (digitaal) archief aanmaken en dit vervolgens overdragen aan bewaarinstellingen.
  • Constructie en onderhoud: Actoren die instaan voor het onderhoud, de verbouwing of renovatie van gebouwen, of voor de reconstructie van verdwenen gebouwen, in het echt of als fysiek en virtueel model.
  • Design: Actoren die digitaal archief hergebruiken om nieuwe ontwerpen te creëren.
  • Kunsten, erfgoed en creatieve sector: Actoren die een culturele werking of erfgoedwerking willen opzetten rond of met het archief. Het gaat hierbij om de creatie van tentoonstellingen, publicaties…
  • Recht: Actoren die archiefmateriaal aanwenden als bewijsstukken om een zeker recht te doen gelden.
  • Historisch onderzoek: Actoren die archiefmateriaal aanwenden als (betrouwbare) informatiebron voor de beantwoording van een historische vraagstelling.

Beroepsgroepen of rollen kunnen onder verschillende categorieën vallen. Een renovatiearchitect zal bijvoorbeeld op zoek gaan naar technische informatie over de constructie (Constructie en onderhoud), maar zal in sommige gevallen ook verplicht zijn de historische context van het gebouw te bestuderen (Historisch onderzoek).

Uit de deskresearch en de interviews kon een lijst van stakeholder requirements worden opgesteld.

Onderzoek naar de functie van de DWG-bestanden binnen het bureau van Maarten Van Severen

Archief is procesgebonden informatie. De reden waarom de documenten werden gemaakt bepaalt hoe ze werden gecreëerd en verwerkt en hoe ze vervolgens door archiefgebruikers kunnen worden geïnterpreteerd. De processen die aan de grondslag liggen van de tekeningen, zijn dan ook een belangrijke parameter om de essentiële eigenschappen van de tekeningen te bepalen.

Maarten Van Severen overleed in 2005 en kon niet meer worden ondervraagd. Wel werd voormalig medewerkster Caroline Lateur bereid gevonden om toelichting te geven over de werkprocessen binnen het bureau. Belangrijke vaststellingen waren dat Maarten Van Severen zelf nooit met AutoCAD tekende en dat de AutoCAD-tekeningen steeds werden geplot om vervolgens door Van Severen te worden becommentarieerd en geannoteerd.

De DWG-bestanden zijn dus vanuit de archiefvorming bekeken van minder belang. De tekeningen in de analoge projectdossiers zijn in dit perspectief veel belangrijkere informatiedragers.

Dit wil niet zeggen dat de DWG-bestanden zomaar moeten worden weggegooid. De DWG-bestanden geven inzicht in de wijze waarop de medewerkers binnen het bureau ontwerpen uitwerkten. Daarnaast houdt hun digitale vorm verschillende voordelen in voor de doelgroepen, namelijk eenvoudige raadpleging achter een computer en nuttige metagegevens zoals de last modified date, waarmee tekeningen chronologisch kunnen worden gesorteerd.

De bewaring van DWG-bestanden in de internationale archiefgemeenschap

Voor de beantwoording van deze vraag, werd beroep gedaan op literatuuronderzoek. Op het moment van research was er al bij al weinig beschikbare literatuur over de preservatie van DWG-bestanden. Er werden zelfs maar 2 studies gevonden die specifiek ingingen op de bewaring van (2D) DWG-bestanden:

Uit deze en andere literatuur werd een lijst van aanbevelingen bekomen die onderdeel dienen uit te maken van het preservatiebeleid voor DWG-bestanden. Deze aanbevelingen kunnen nagelezen worden in het rapport en bieden het noodzakelijke kader waarin het onderzoek naar de meest adequate bewaarstrategie kan plaatsvinden.

Onderzoek naar de meest adequate bewaarstrategie

Uit het literatuuronderzoek kwamen enkele mogelijke bewaarstrategieën naar boven, maar het was onduidelijk welke bewaarstrategie de meest adequate was. Ook ontbrak info over de toepassing van de bewaarstrategieën voor een bulk van DWG-bestanden in het archief.

Om de meest adequate bewaarstrategie te bepalen, werd gebruik gemaakt van de preservation planning workflow van de PLATO-tool. Deze tool is ontwikkeld als onderdeel van het PLANETS project (Preservation and Long-term Access through Networked Services) door het Digital Preservation lab aan de Technologische Universiteit van Wenen.

De workflow veronderstelt het doorlopen van een aantal fases om tot een volledig preservatieplan te komen voor de digitale objecten. Dit komt op het eerste zicht wat abstract over, maar de documentatie van de website voorziet in een aantal case-studies die duidelijk maken hoe de PLATO-workflow concreet kan worden toegepast. Hieronder gaan we verder in op de wijze waarop iedere fase specifiek werd toegepast tijdens het Maarten Van Severen-project.

De PLATO-website biedt naast het kader ook de tool aan waarmee het preservatieplanningproces kan worden ondersteund. Tijdens de test werd de tool echter al vrij snel verlaten voor Excel, dat veel soepeler bleek voor de ondersteuning van dit proces.

Defining the basis

Dit houdt het bredere kader in waarbinnen het preservatieplan wordt opgesteld. Wat voor digitale objecten worden door wat voor organisatie bewaard voor welke doelgroepen? Een groot deel van dit werk is feitelijk het vastleggen van de noden van de doelgroepen, wat we hierboven al hebben uiteengezet.

Identify requirements

Dit is wellicht het belangrijkste onderdeel van de workflow. Het bepaalt waaraan de preservatie van de DWG-bestanden moet voldoen. Dit houdt een vertaling in van de noden van de doelgroepen naar de essentiële eigenschappen van DWG-bestanden en veronderstelt een grondig inzicht in de opbouw van DWG-bestanden. Langs de andere kant dienen ook de niet-functionele noden te worden gezocht. Is de gekozen oplossing niet te duur? Is de oplossing schaalbaar? Hoe betrouwbaar is de oplossing enz.

Conform de aanbevelingen van de PLATO-workflow werden de requirements daarom opgedeeld in object characteristics (dit zijn de eigenschappen van de 2D DWG-bestanden) en infrastructure characteristics (dit zijn de eigenschappen waaraan het migratieproces moet voldoen).

Object characteristics

Om object characteristics te definiëren wordt doorgaans gebruik gemaakt van een indeling van eigenschappen in inhoud, structuur, look & feel, gedrag en metadata of context. Specifiek voor DWG-bestanden leek deze indeling wat geforceerd. Ook werd al snel duidelijk dat het puur visueel afleiden van de eigenschappen neerkwam op “nattevingerwerk”.

Om de definiëring van de object characteristics grondiger te kunnen doen, werd daarom teruggegrepen naar specificatiedocumenten voor 2D CAD-bestanden. De specificatie van het DXF-formaat, een uitwisselingsformaat voor DWG, is vrij beschikbaar en geeft een goed inzicht in de elementen waaruit een DXF-bestand bestaat. Ook voor DWG is een specificatie opgesteld, zij het niet door Autodesk (en dus minder betrouwbaar), maar deze specificatie bleek veel moeilijker te interpreteren en was daarom minder bruikbaar dan die van DXF.

Andere hulpmiddelen waren de CAD-tools zelf. De tool BricsCAD, die DWG-bestanden kan openen, beschikt bijvoorbeeld over een handige functie: ‘Drawing Explorer’. Deze tool geeft een overzicht van de eigenschappen van het document en laat toe om deze te onderzoeken.

Uiteindelijk werd volgende onderverdeling bekomen voor de object characteristics.

Geometrie

Punten, lijnen en geometrische vormen waarmee de tekening is geconstrueerd, alsmede hun posities en afmetingen.

Intelligentie

Alle niet-geometrische eigenschappen die RECHTSTREEKS aan een geometrisch element (punt, lijn, vorm…) zijn verbonden. Het gaat hier meestal om de kleur (indien belangrijk voor interpretatie), lijndikte, lijntype, het al dan niet behoren tot een laag…

Structuur

Alle eigenschappen die de algehele structuur van de tekening bepalen (en niet verbonden zijn aan één specifiek geometrisch element), zoals de lagen en hun eigenschappen, de blocks en hun eigenschappen, de gebruikte coördinatenstelsels, de gebruikte eenheden, het onderscheidt tussen model spaces en lay-outs enz.

Afhankelijke bestanden

Bestanden die op een of andere manier verbonden zijn met het bestand dat moet worden gepreserveerd. Vaak vormen ze samen de representatie van het archiefdocument. Het kan gaan om bestanden met informatie over de gebruikte lettertypes, bestanden met informatie over de wijze waarop de tekening moet worden geplot, tot DWG-bestanden waarnaar wordt verwezen (XREF’s).

Embedded files

Bestanden die zijn ingebed in het bestand dat moet worden gepreserveerd. Vaak gaat het om PDF’s of rasterafbeeldingen die als onderlaag worden gebruikt voor de tekening.

Look & feel

Alle informatie die niet essentieel is voor de interpretatie van de tekening, maar enkel wordt toegevoegd omwille van het design, of om een aangename leeservaring te creëren.

Gedrag

Alle interactieve en functionele eigenschappen van het document. Manipulatie zoals zoomen en roteren, printeigenschappen, het tonen en verbergen van onderdelen, het bewerken van onderdelen enz.

Iedere eigenschap kon onderverdeeld worden in subeigenschappen, die op hun beurt konden worden onderverdeeld in andere subeigenschappen, waaruit een gehele hiërarchie van eigenschappen ontstaat.

Het is niet voldoende om enkel de eigenschappen te definiëren. Ook moet worden nagedacht over mogelijke resultaten na migratie van een eigenschap. Voor de look-and-feel werden meestal volgende waarden gebruikt:

  • Exact
  • Aanvaardbare wijziging
  • Onaanvaardbare wijziging
  • Niet van toepassing
  • Niet te achterhalen

Voor intelligentie-eigenschappen ging het om volgende waarden:

  • Correcte waarde
  • Incorrecte waarde
  • Niet mogelijk
  • Niet van toepassing
  • Niet te achterhalen

Infrastructure characteristics

Voor de infrastructure characteristics werd een onderscheid gemaakt tussen archiveringsformaat en migratietool. Eigenschappen voor een emulatiestrategie werden niet onderscheiden, omdat op voorhand was uitgemaakt dat dit niet zou worden onderzocht.

Voor het archiveringsformaat ging het om de klassieke eigenschappen van een goed archiveringsformaat, met name stabiliteit, standaardisering, adoptie, validatie- en identificatiemogelijkheden, transparantie, metadata support, robuustheid, legaliteit, openheid van specificatie en reversibiliteit. Maar ook de grootte van de bestanden t.o.v. het oorspronkelijke formaat werd onder de loep genomen.

Voor de migratietool ging het om eigenschappen als stabiliteit, kost, performantie en rapportering.

Meer dan bij de object characteristics was het in deze categorie een uitdaging om te definiëren hoe een bepaalde eigenschap kon worden vastgesteld. Hoe meet je bv. de adoptie (de verspreiding van het gebruik) van een bestandsformaat? Een oplossing was om “adoptie” onder te verdelen in verschillende eigenschappen, zoals:

  • Aantal softwarepakketten die het formaat rechtstreeks kunnen weergeven
  • Aantal softwarepakketten die het formaat kunnen importeren
  • Aantal softwarepakketten die het formaat kunnen bewerken

Hoe meer softwarepakketten, hoe beter de adoptie van een bepaald archiveringsformaat. Een belangrijke voorwaarde hierbij was dat de softwarepakketten van verschillende bedrijven moesten zijn. Volgende mogelijke resultaten werden steeds toegekend.

  • Bestandsformaat ondersteund door drie of meer programma's van verschillende bedrijven
  • Bestandsformaat ondersteund door minder dan drie programma's van verschillende bedrijven
  • Bestandsformaat niet ondersteund
  • Niet van toepassing
  • Niet te achterhalen

Een bijzonder handig hulpmiddel bij dit alles was een mindmapping-tool. Een mindmap laat heel eenvoudig en flexibel toe om hiërarchische structuren uit te tekenen en is daarom ideaal voor dit werk. Tijdens dit project werd de gratis mindmapping-tool Freemind gebruikt. Een voorbeeld van de requirements tree voor 2D DWG-bestanden in Freemind vind je hier.

Snapshot van één van de sample files.

Define sample objects

Volgens de PLATO workflow dient de identificatie van de sample objects te gebeuren vooraleer de requirements worden gedefinieerd. Deze volgorde hebben wij omgedraaid. Het leek ons immers logischer om eerst de eigenschappen te bepalen en vervolgens die sample objects te selecteren die representatief waren voor de eigenschappen die moesten worden behouden.

De keuze viel op:

  • Een DWG-bestand met een modelspace en een paperspace. In de modelspace van het bestand wordt de tekening "getekend". In de paperspace schikt de architect de tekening zoals ze moet worden afgedrukt. Dit representeert het overgrote deel van de DWG-bestanden binnen het projectdossier van het Van Abbemuseum.
  • Een DWG-bestand met modelspace en paperspace en een XREF. XREFs zijn externe verwijzingen naar andere CAD-bestanden die behouden dienen te blijven.
  • Een DWG-bestand met bijbehorende .pcp- of .pc2-bestand. Deze bestanden bevatten de plotinstellingen van de DWG-bestanden. Aangezien de geplotte tekeningen vaak de eindproducten waren, vormen deze bestanden een onderdeel van de representatie van het archiefdocument.

Daarnaast werden nog 5 andere willekeurige DWG-bestanden gekozen, om batchmogelijkheden uit te testen.

Define alternatives

In deze fase van de PLATO workflow dienen de verschillende mogelijke bewaarstrategieën te worden geformuleerd die moeten worden uitgetest. De belangrijkste basis hiervoor was het literatuuronderzoek dat we in een eerdere fase hadden uitgevoerd. Volgende alternatieven werden uitgetest:

  1. Migratie naar archiveringsformaat DXF met native application AutoCAD
  2. Migratie naar archiveringsformaat DXF met Teigha File Converter
  3. Migratie naar archiveringsformaat (TEIGHA) DWG met Teigha File Converter
  4. Migratie naar archiveringsformaat PDF/E-1 met Adobe Acrobat X
  5. Migratie naar archiveringsformaat PDF via de plotfunctie van DWG Trueview
  6. Geen actie ondernemen: Behoud van het originele formaat DWG

Een belangrijke parameter in het bepalen van de alternatieven was het bestaan van twee softwarebibliotheken voor DWG. Aan de ene kant is er de RealDWG-bibliotheek, die wordt onderhouden door het bedrijf Autodesk, eigenaar van AutoCAD. Aan de andere kant is er de Teigha-bibliotheek, een bibliotheek onderhouden door de Open Design Alliance. De Open Design Alliance is een consortium van Autodesk-concurrenten die via backward engineering hun eigen (open) specificatie hebben ontwikkeld van het DWG-formaat. Voor de aanvang van de experimenten werd ervan uitgegaan dat RealDWG-software betrouwbaarder is dan de Teigha-software, omdat de eerste beschikking heeft over de “echte” DWG-specificatie van Autodesk.

Aan de hand van het literatuuronderzoek werden een aantal mogelijke strategieën geschrapt. Migratie naar archiveringsformaat STEP wordt in veel gevallen voorgesteld, maar uit eerder onderzoek is al gebleken dat STEP niet voldoende wordt ondersteund door de tools. De ondersteuning van STEP en belangrijker nog, IFC, dient wel opgevolgd te blijven worden.

Develop experiments

In deze fase moet worden beschreven hoe de geselecteerde strategieën zullen worden uitgetest. Hoe ga je daarbij concreet te werk? Volgend stappenplan werd uitgezet en doorlopen:

  1. Documenteren van de systeemvariabelen van de computeromgeving(en) waarop de experimenten verlopen. De beschikbare hoeveelheid RAM van de testcomputer heeft bv. een invloed op de performantie van de strategie
  2. Uittesten van batchverwerking van de migratietool, indien beschikbaar
  3. Veel migratietools geven je veel keuzeopties voor het doelformaat (in het bijzonder voor migratie naar PDF). Hierin dient een keuze te worden gemaakt en deze keuzes dienen te worden gedocumenteerd
  4. Onderzoek naar de mate waarin het archiveringsformaat de essentiële eigenschappen bewaart: Er werd voor gekozen om dit te doen door voor elk archiveringsformaat een “meest betrouwbare viewer” te kiezen. Voor DXF of DWG was dit DWG Trueview, voor de PDF-formaten Adobe Acrobat. Er werd vervolgens visueel gecontroleerd hoe de essentiële eigenschappen werden weergegeven in deze viewers
  5. Onderzoek naar de adoptie van het archiveringsformaat. Hoe worden de essentiële eigenschappen van het originele bestand in andere software weergegeven? Ook dit werd visueel gecontroleerd. Hiervoor werden gratis tools of tools met een trialversie gebruikt, zoals BricsCAD (trial), LibreCAD (gratis), GoogleSketchup (gratis) en TeighaViewer (gratis).
  6. Onderzoek naar de validatiemogelijkheden van het archiveringsformaat
  7. Onderzoek naar de rapporteringsfunctionaliteiten van de migratietool

Alles is nu klaar om de experimenten te doorlopen. Al de geselecteerde migratietools konden gratis of via een trialversie worden bekomen.

Evaluate experiments

In deze fase dienen de resultaten van de experimenten te worden geëvalueerd. Hoe goed scoren de bewaarstrategieën op object en infrastructure characteristics?

Punten werden gegeven door kruisjes in te vullen bij de vastgestelde waardes.

Snapshot van het evaluatieformulier voor bewaarstrategieën voor 2D DWG-bestanden
Belangrijke vaststelling bij deze fase was dat

enkel vertrouwen op visuele controle niet nauwkeurig genoeg was. De CAD-bestanden zijn zo complex en bevatten zoveel details, dat het quasi onmogelijk is om kleine wijzigingen op te merken.

Daarnaast is het niet enkel voldoende een vooraf gedefinieerde waarde in te geven. Het is belangrijk om dit verder te documenteren voor het eindoordeel. Welke layereigenschappen werden bijvoorbeeld precies niet geregistreerd? Is daar ook een reden voor?

Tot slot wordt de weergave van erg veel eigenschappen bepaald door de viewer. Eigenschappen die aanvankelijk niet goed waren overgenomen, bleken achteraf door een andere instelling in de viewer te worden opgelost.

Transform measured values

Met een waardering in de vorm van “JA/NEE” of “Exact ; Aanvaardbare wijziging ; Onaanvaardbare wijziging” heb je nog geen kwantitatieve score. De kwalitatieve waardes moeten daarom worden omgezet naar een numerieke waarde. Hiervoor is een schaal van 1 – 5 gekozen. Indien het gaat om een resultaat dat de hele strategie irrelevant maakt (een knock-out criterium), wordt een “0-waarde” gegeven. Voorbeelden van knock-outcriteria zijn grote fouten in de geometrie, of het niet meer ondersteund worden van een archiveringsformaat.

Snapshot van het formulier voor de evaluatie van bewaarstrategieën voor 2D DWG-bestanden: Transformatie van waarden

Set importance factors

Niet alle eigenschappen zijn van even groot belang. Om het belang aan te duiden, werkt de PLATO workflow met het toekennen van een gewicht aan de eigenschappen, aan de hand van een percentage. Per hiërarchisch niveau wordt het gewicht toegekend. Onderstaande tabel toont aan dat behoud van de object characteristics een belang kregen van 60 % t.o.v. de Infrastructure characteristics, die een belang kregen van 40 %.

Op het tweede niveau werd eveneens een waardering toegekend. In de eindwaardering betekent dit dat de eigenschap “Archiefformaat” voor (0,4 * 0,6 = 0,24) 24 % meetelt. Dit gaat zo door per niveau. De licentiekost per jaar van de migratietool telt bijvoorbeeld mee voor 3,92 %. (0,4 * 0,4 * 0,35 * 0,7 = 0,0392).

Snapshot van de requirements tree voor 2D DWG-bestanden met gewichtstoekenning

Indien de bewaarstrategie voor deze eigenschap een “5” scoort, wordt deze score omgerekend naar 0,196 (5 * 0,0392 = 0,196). Op die manier wordt bekomen dat elke eigenschap een score krijgt conform zijn belang in het geheel van eigenschappen.

Tijdens het onderzoeksproject over het digitaal archief van Maarten Van Severen, werden de importance factors afgeleid uit de noden van de doelgroepen, zoals die naar boven kwamen uit de interviews. De doelgroepen werden niet nog eens betrokken bij het toekennen van het gewicht. Het is daarbij de vraag of dit in de toekomst niet beter wel zou gebeuren. Een belangrijk struikelblok hierbij kan de techniciteit van de materie zijn, die niet iedere doelgroep even goed onder de knie heeft.

Het toekennen van een gewicht aan eigenschappen zal in ieder geval altijd subjectief zijn. Daarnaast is het erg tijdrovend. Bovendien is de toekenning relatief, aangezien het uiteindelijke kwantitatieve eindresultaat toch altijd weer kwalitatief zal moeten worden geanalyseerd.  Daarom kan deze stap ook worden overgeslagen. Wanneer echter heel veel alternatieven moeten worden onderzocht en het aantal requirements erg groot is, kan dit helpen om selecties te maken.

Analyse results

In deze laatste fase worden de resultaten opgelijst en beoordeeld. Onderstaande lijst geeft de uiteindelijke scoretabel (met maximumscore 5):

Strategie

Totaalscore

Score archiveringsformaat (24 %)

Score migratietool (16 %)

Score Object characteristics (60 %)

Origineel bestandsformaat DWG als archiveringsformaat

4,5521

0,7416

0,8

3,0105

Migratie DWG met Teigha File Converter

4,5201

0,8616

0,648

3,0105

Migratie DXF met Teigha File Converter

4,4841

0,8376

0,648

2,9985

Migratie DXF met recentste versie AutoCAD (2016)

4,3433

0,8376

0,5072

2,9985

PDF/E Acrobat X Pro

3,68246

0,9984

0,6584

2,02566

PDF plot DWG Trueview 2015

3,38726

0,9072

0,4544

2,02566

Dit eindresultaat geeft duidelijk de relativiteit van de kwantitatieve scores weer. Het behoud van het origineel bestandsformaat DWG scoort bv. het beste, maar het is ook duidelijk dat dit het zwakste archiveringsformaat is. (1,2 is de maximumscore voor het archiveringsformaat) Het is daarom belangrijk niet enkel blindelings op de scores af te gaan, maar deze resultaten ook kwalitatief te analyseren.

Tijdens dit project werd ervoor gekozen om een kwalitatieve beoordeling bij te maken, met [https://17dc523db9bf0692d991-f9b61dd6c69493800b6f880d3ff13732.ssl.cf3.rackcdn.com/20161102_gevalstudieCEST_analyse-kwalitatief.pdf sterke punten, zwakke punten en risico’s] voor elke bewaarstrategie.

Het eindoordeel is dat 2D DWG-bestanden op korte termijn zonder al te veel risico’s bewaard kunnen worden in het origineel formaat. Het is dan wel geen betrouwbaar archiveringsformaat, maar de ondersteuning van DWG binnen de sector en het bestaan van een backward engineered specificatie vermindert de risico’s sterk. Een belangrijke factor waarmee rekening moet worden gehouden zijn echter de verschillende DWG-versies. Tools zoals Adobe Acrobat en zelfs DWG Trueview ondersteunen de verschillende versies niet even goed. Om de beheersbaarheid van DWG binnen een depot te verhogen, is het daarom belangrijk om het aantal versies terug te dringen.

Wanneer tot migratie moet worden overgaan bleek uit deze test dat de tool Teigha File Converter OP DIT MOMENT de beste resultaten geeft. Wanneer opslagruimte geen kwestie is, heeft bestandsformaat DXF daarbij de voorkeur als archiveringsformaat. Wel is het nog noodzakelijk om deze resultaten bevestigd te zien door verdere testing.

Define preservation plan

De laatste fase van de PLATO workflow, de bewaarstrategie uitwerken in een preservatieplan, werd tijdens dit onderzoek niet voltooid. Eén van de redenen daarvoor is dat een preservatieplan moet worden geschreven op maat van iedere instelling. De doorlopen fases geven echter de noodzakelijke bouwstenen voor het opstellen van een preservatieplan.

Resultaten

Een requirements list voor 2D DWG-bestanden

Eén van de resultaten van het traject is een lijst van eigenschappen van 2D DWG-bestanden, die kan dienen als checklist voor verschillende bewaarstrategieën. Het opstellen van deze lijst is erg arbeidsintensief, maar van blijvende waarde.

Niet alleen is de kennis binnen het CVAa over de structuur van DWG-bestanden nu gedetailleerder geworden, ook is de lijst een handige basis om nieuwe bewaarstrategieën uit te testen en te vergelijken. Wanneer AutoCAD in de toekomst batch-migratie beter zal ondersteunen, of export naar bestandsformaten als STEP of IFC, dan kunnen deze nieuw beschikbare bewaarstrategieën snel worden uitgetest en vergeleken. Bij een migratie- of normalisatiestrategie zal er bovendien op termijn altijd weer een nieuwe migratie en denkoefening moeten gebeuren.

Tot slot is de lijst generiek genoeg opgesteld om – mits aanpassingen – toegepast te worden voor andere 2D CAD-bestanden, zoals VWX.

Hierbij dient te worden opgemerkt dat de lijst niet vastligt. Er kunnen in de toekomst nieuwe eigenschappen voor 2D CAD-formaten bijkomen, door nieuwe ontwikkelingen in de software. Daarnaast is het zeker nuttig om dergelijke lijsten af te stemmen met die van andere bewaarinstellingen.

Inzicht in de beschikbare mogelijkheden voor 2D DWG-preservatie

Over de preservatie van 2D DWG-bestanden waren reeds enkele zaken bekend, zoals kandidaat-archiveringsformaten en mogelijke tools, maar het CVAa had nog geen zicht op welke methode nu de meest adequate was. Na deze oefening is het inzicht in de betrouwbaarheid, de performantie en de risico’s van de alternatieven bijzonder gegroeid.

Zo is duidelijk aangetoond dat de grote verscheidenheid van DWG-versies een belangrijk risico vormt. Een andere vooronderstelling, namelijk dat migraties met Autodesk-producten betrouwbaarder zouden zijn dan migraties die gebruikmaken van de Teigha-bibliotheek, bleek daarentegen ongegrond.

Een zeer belangrijke conclusie is ten slotte dat migratie naar PDF, wat binnen de sector vaak als de meest haalbare optie werd beschouwd voor 2D DWG-bestanden, naar voren kwam als één van de moeilijkst te realiseren opties. Batch-migratie naar PDF kan, maar leidt tot veel meer verlies van eigenschappen en is bovendien onbetrouwbaarder (en trager) dan een migratie in batch naar DXF met Teigha File Converter.

Expertise in het methodisch uittesten van bewaarstrategieën

2D DWG-bestanden vormen een belangrijk aandeel in de digitale archieven van veel architecten.  Er zijn echter nog andere bestandsformaten waarvoor een bewaarstrategie moet worden uitgetekend en waarin het CVAa een rol kan spelen.

Met deze oefening is hiervoor een belangrijke basis gelegd. Ook is duidelijk geworden dat enkele zaken nog dienen te worden verfijnd. Het is immers gebleken dat er meer moet worden gewerkt met andere controlemiddelen dan louter visuele. Specifiek voor 2D DWG-bestanden werd hiervoor al een alternatief gevonden in de AutoCAD-optie DATAEXTRACTION. Dit commando exporteert alle eigenschappen van DWG-files naar CSV-bestanden, die nadien kunnen worden vergeleken.

In Bijlage 5 van het rapport over het Maarten Van Severen archief is een oefening beschreven waarbij het CSV-bestand van een oorspronkelijke DWG werd vergeleken met de CSV-bestanden die werden verkregen met de DXF’s en DWG’s die werden verkregen uit Teigha File Converter. De test bleek niet eenvoudig uit te voeren, maar was toch veelbelovend. Ook leek deze test te bevestigen dat een migratie via de Teigha-bibliotheek inderdaad slechts tot weinig verlies van eigenschappen leidt. Verdere tests dienen echter nog te gebeuren om dit definitief te bevestigen.

Bronnen

Vanstappen, H., Opname en verwerking van born digital objecten uit een architectuurarchief, 2013, raadpleegbaar op http://www.cvaa.be/sites/default/files/publicaties/cadarchivering_rapport_2013_v0_7.pdf

Cocciolo, A., Digitally Archiving Architectural Models and Exhibition Designs: The Case of an Art Museum, 2015, raadpleegbaar op https://practicaltechnologyforarchives.org/issue4_cocciolo/

Guttenbrunner, M., Digital Preservation of Console Video Games, Wenen, 2007, raadpleegbaar op http://www.ifs.tuwien.ac.at/~becker/pubs/guttenbrunner_games2007.pdf

Becker, C., Kulovits, H. e.a., "Systematic planning for digital preservation: evaluating potential strategies and building preservation plans", in International Journal on Digital Libraries (IJDL), december 2009, raadpleegbaar op http://www.ifs.tuwien.ac.at/~becker/pubs/becker-ijdl2009.pdf

Ball, A., Preserving Computer Aided Design (CAD), DPC Technology Watch Report 13-02 April 2013, raadpleegbaar op http://www.dpconline.org/component/docman/doc_download/896-dpctw13-02pdf

Boudrez, F., Digitaal Archiveren: Richtlijn & Advies nr. 10, Migratie naar archiveringsformaten, Versie 1.1, 2010, raadpleegbaar op http://www.edavid.be/davidproject/teksten/Richtlijn10.pdf     

Contactgegevens

Wim Lowet

Vlaams Architectuurinstituut

Jan Van Rijswijcklaan 155

B-2018 Antwerpen

wim.lowet@vai.be

www.vai.be