Publicatie:RDF Triples

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen


Samenvatting

Trojka, drietal, triumviraat is een combinatie van drie elementen die volgens een logica samenwerken. In de digitale wereld staat een triple voor een speciale drievoudige manier van het structureren van data waarmee netwerken van kennis gecreëerd kunnen worden. Hoe worden triples in de erfgoedsector toegepast?


Referentie
Titel RDF Triples (Voorkeurstitel)
Locatie META Nummer 2017/9
Uitgever
Jaar van uitgave 2017
Rechten CC-BY-SA
Persistent ID


Auteur

Alina Saenko (PACKED VZW)

Een semantische triple

Trojka's van gegevens. Maslenitsa (Pyotr Gruzinsky, 1898).

De meest gangbare manier om kennis digitaal te verzamelen en te structureren is het gebruik maken van tabellen. Het principe achter de meeste collectiebeheersystemen is die van relationele databanken, waarbij verschillende soorten objecten in aparte tabellen beschreven worden en de inhoudelijke relaties tussen die tabellen als links gedefinieerd worden.

Een andere manier om kennis te structureren is door gegevens te noteren als in een aaneenschakeling van simpele en natuurlijke stellingen, bestaande uit drie elementen: subject - bewering - object. Die stellingen worden volgens de RDF-standaard [1] samengesteld en worden daarom RDF-triples genoemd. Bijvoorbeeld: META - is - een tijdschrift. Elk element van een triple kan op zijn beurt ook een triple zijn: META - is - (een tijdschrift - is een vorm van - publicatie). Zo kunnen veel stellingen inhoudelijk aan elkaar gelinkt worden in een grafe, een netwerk van kennis.

Elk element in een triple kan opgenomen worden als een persistente URI [2] die dit element identificeert op het web. Onze triple over META zou er dan zo uitzien: https://www.vvbad.be/meta - http://xmlns.com/foaf/spec/#is - http://xmlns.com/foaf/spec/#term_publications. Op die manier zal een machine of een programma exact weten over welke META het in die triple gaat en de inhoud van de triple juist interpreteren.

Databanken die gegevens in triples bewaren worden triplestores genoemd. Een standaard machineleesbaar formaat voor triples is RDF/XML[3], vergelijkbaar met MARC XML of LIDO XML, waarmee collectiebeheersystemen in de erfgoedsector werken.

Toepassing

De registratie van consistente sets van gegevens over collectieobjecten wordt goed opgevangen in traditionele tabellen en relationele databanken. Een beschrijving van een object is echter nooit compleet. Om later andere soorten weetjes toe te voegen in tabellen met vaste structuur moeten er kolommen bijgemaakt worden en dat is technisch niet eenvoudig in een relationele databank. De registratie van zulke willekeurige feiten en veranderende beschrijvingen wordt veel beter door het uitbreidbare netwerk van triples opgevangen. Triples volgen namelijk een natuurlijke logica, vergelijkbaar met hoe gegevens in onze hoofden verzameld, verwerkt en toegevoegd worden. Datasets die online beschikbaar worden gemaakt in de vorm van triples kunnen daarom ook makkelijk samengevoegd worden tot een grote triplestore.

Kennis gestructureerd als netwerk van triples kan ook veel beter integraal bevraagd worden. Een gewone relationele databank zou je niet snel een ant- woord kunnen geven op de vraag: “Vind alle kunstwerken in mijn collectie die te maken hebben met natuur en waarvan de creator meer dan 70 jaar overleden is”. Zo’n ingewikkelde en interessante vragen kunnen wel aan een netwerk van triples gesteld worden. En op het web, waar het samenvoegen van allerlei verschillende netwerken van kennis mogelijk is, wordt het nog spannender. Hoe meer gegevens online in de vorm van triples toegankelijk worden gemaakt en uitgewisseld worden, hoe meer interessante inzichten en onderzoeken er mogelijk zijn.

Voetnoten

  1. Voor meer info, zie https://www.w3.org/RDF/
  2. Een persistente URI is een link op het web die op lange termijn onveranderd blijft en daarom betrouwbaar genoeg is om een ding online te identificeren. Voor meer info zie artikel Persistente links, META 2013|5, p. 31
  3. Voor meer info, zie https://www.w3.org/TR/2014/REC-rdf-syntax-grammar-20140225/. Daarnaast bestaan er ook andere formaten: Turtle, N-Triples, N-Quads, JSON-LD, Notation3.