Projecten:Archivering Sociale Media

From Cultureel Erfgoed Standaardentoolbox
Jump to navigation Jump to search

Sociale media vervullen vandaag een belangrijke rol in de communicatie over diverse maatschappelijke onderwerpen door een brede waaier van actoren. Ondanks hun belang als bron voor (wetenschappelijk) onderzoek, worden ze nog steeds weinig gearchiveerd. Dit project ontwikkelt best practices voor het capteren, archiveren en ontsluiten van sociale media in Vlaanderen en Brussel en wordt ondersteund door de Vlaamse Overheid. Het is opgedeeld in volgende fasen:

  • Fase 1: captatie en archivering van individuele social media accounts (1 september 2020 - 31 augustus 2021)
  • Fase 2: captatie en archivering van social media met behulp van API’s en tools voor derden (1 september 2021 - 31 augustus 2022)
  • Fase 3: toegang tot en hergebruik van gearchiveerde social media (1 september 2022 - 31 augustus 2023, indien toegekend)

Hieronder vindt u een overzicht van alle werkpakketten en de gepubliceerde handleidingen en bevindingen.

Fase 1: captatie en archivering van individuele social media accounts

WP1: voorbereiding van de captatie van individuele accounts

Dit werkpakket omvat het onderzoek en de keuze van de API's en tools voor de captatie, het opzetten van workflows en de nodige technische infrastructuur, een analyse van de te capteren sociale media streams en de opstart van de voorbereidende gesprekken i.v.m. de ingest van de te capteren sociale media streams.

T1.1: Keuze van API's en tools voor captatie van individuele accounts:

  • analyse en selectie van API's en captatietools om individuele accounts te capteren

T1.2: Opzetten van captatieworkflow en technische infrastructuur:

  • het opzetten van workflows voor de captatie van individuele accounts
  • opzetten van de technische infrastructuur waarin de geselecteerde captatietools worden gekoppeld aan een digitaal archief
  • en de opmaak van handleidingen voor de zelfarchivering van individuele accounts.

T1.3: In kaart brengen van de noden i.v.m. het capteren van sociale media streams:

  • analyse van de noden van de archiefinstellingen
  • analyse van de noden van potentiële externe gebruikers van de te archiveren social media streams

T1.4: Analyse van de te capteren social media strams:

  • toegang regelen tot individuele accounts m.b.v. overeenkomsten
  • inschatting rechtensituatie van de data uit pilootprojecten
  • afbakening van de dataset op basis van een analyse van de data/gebruik van accounts (alles, bepaalde periode, bepaalde contacten, ...)

T1.5: Voorbereiding ingest van de te capteren social media streams:

  • opstart van de voorbereidende gesprekken met de diverse betrokken partijen over de ingest van te capteren social media streams
  • uittekenen van de ingestworkflow(s)

Resultaten

WP2: captatie van individuele accounts

Dit bestaat uit elf pilootprojecten waarin diverse social media accounts worden gecapteerd. De captaties werden uitgevoerd door alle partners in het project.

Kanalen:

  • Instagram
  • Twitter
  • Facebook
  • YouTube

Resultaten

WP3: ingest en preservering

Dit werkpakket betreft de ingest en preservering van een reeks sociale media accounts in de vorm van respectievelijk SIP's en AIP's. Het omvat zowel het definiëren van de minimale eisen waaraan de SIP's en AIP's moeten voldoen als de uitvoering van de drie pilootprojecten.

T3.1: Voorbereidend onderzoek SIPs en AIPs:

  • definiëren van specificaties waaraan de SIPs en AIPs moeten beantwoorden, incl. formaten en metadataschema.

T3.2: Pilootproject meemoo:

  • Ingest van data in het archiefsysteem van meemoo.

T3.3: Pilootproject KADOC:

  • Ingest van data in het archiefsysteem van KADOC.

T3.4: Pilootproject AIDA:

  • Ingest van data in het archiefsysteem van AIDA (o.v., niet uitgevoerd)

Resultaten

WP4: voorbereidend onderzoek in functie van het capteren van sociale media

Dit omvat de analyse van de API's en tools voor derde partijen om sociale media te capteren en een afbakening van de dataset.

T4.1: Keuze van API's en tools voor derde partijen voor captatie van sociale media:

  • analyse van API's en tools.

T4.2: Analyse van de te capteren sociale media:

  • afbakenen van de dataset op basis van een analyse van de data.

Resultaten

WP5: projectmanagement, communicatie en disseminatie

Het omvat de organisatie van de bijeenkomsten van de stuur- en klankbordgroep, de coördinatie van de verschillende betrokken partners, de projectadministratie, de communicatie over het project en het delen van de projectresultaten via diverse kanalen.

Resultaten

Fase 2: captatie en archivering van social media met behulp van API’s en tools voor derden

WP1: voorbereiding van de captatie van individuele accounts en social media streams op basis van trefwoord (event based activity streams)

Het omvat het in kaart brengen van noden, bijsturing van de evaluatiecriteria, administratie voor de opstart van de test, opzetten van infrastructuur voor de test en selectie van de te capteren data streams.  

T1.1: In kaart brengen van de noden i.v.m. het capteren van social media streams op basis van trefwoord:

  • vastleggen te capteren social media streams op basis van trefwoord
  • analyse van de noden van de archiefinstellingen
  • analyse van de noden van potentiële externe gebruikers van de te archiveren social media streams (in bijzonder digital humanities onderzoekers)

T1.2: Bijsturing evaluatiecriteria:

  • vastleggen van criteria om te evalueren of de captatie van social media streams op basis van trefwoord goed is uitgevoerd (met inachtneming van de vastgestelde noden en de analyse uit WP4 van fase 1)
  • bijsturing evaluatiecriteria uit fase 1 i.f.v. tests met betalende tools

T1.3: Voorbereiding van tests met betalende tools en API’s:

  • overleg met leveranciers
  • afsluiten van overeenkomsten voor het doorlopen van een trial, opzetten van een proof of concept of gebruik van een API key (indien nodig)
  • verzamelen van documentatie over en opmaken van handleidingen bij de tools  

T.4: Opzetten van de technische infrastructuur en vooronderzoek i.f.v. captatie rechtstreeks via API van het platform:  

  • vooronderzoek op basis van technische documentatie
  • opzetten van infrastructuur voor captatie rechtstreeks via API van minstens één platform;
  • vertaling van noden in een functionele analyse

T1.5: Selectie te capteren accounts:

  • selectie van minstens 6 relevante accounts uit de pilootprojecten van fase 1 om (opnieuw) te capteren als onderdeel van WP3

Resultaten

WP2: voorbereiding WP4 en WP5 (juridisch kader) en voorbereiding fase 3 toegang tot en hergebruik van gearchiveerde social media

Het omvat het verder uitdiepen van juridische voorwaarden voor captatie en archivering, initieel onderzoek naar ontsluitingsmogelijkheden en mogelijke use cases.

T2.1: Uitdiepen juridische voorwaarden:

  • uitdiepen van juridische voorwaarden voor captatie en archivering uit fase 1 als raamwerk voor verdere ontsluiting (fase 3) in overleg met juristen
  • mogelijkheden nagaan voor het opstellen van een generiek addendum bij de archiveringsovereenkomst (schenking/bewaargeving) van erfgoedinstellingen in overleg met de content partners van de pilootprojecten

T2.2: Initieel onderzoek naar mogelijkheden voor ontsluiting en hergebruik:

  • oplijsten generieke use cases voor het ontsluiten en hergebruiken van gearchiveerde social media voor en door diverse doelgroepen
  • oplijsten van praktijken voor diverse doelgroepen in België en buitenland  

T2.3: Zoeken naar partners voor pilootprojecten:

  • selectie van use cases uit T2.2 en vertaling in nieuwe inspirerende pilootprojecten die uitgewerkt kunnen worden in fase 3
  • contacten met mogelijke nieuwe partners voor de pilootprojecten in fase 3

Resultaten

  • D3: Tussentijds verslag betreffende juridische voorwaarden voor captatie en archivering

WP3: captatie van accounts en social media streams op basis van trefwoord m.b.v. betalende tools voor derden en API’s

Het omvat pilootprojecten waarin diverse social media accounts en streams worden gecapteerd d.m.v. minstens drie verschillende tools of API’s.

T3.1: Configuratie van tools en API’s:

  • onderzoeken van mogelijkheden van tools en API’s met testset
  • documenteren van instellingen

T3.2: Pilootproject op basis van trefwoord:

  • captatie van Twitter-, Instagram- en Facebook streams op basis van de trefwoorden (bv. “gokken” of “e-sports”)

T3.3: Hernemen van de pilootprojecten van fase 1 (afhankelijk van de mogelijkheden in de trials)

T3.4: Evaluatie van de gebruikte tools en API’s

Resultaten

WP4: evaluatie en vergelijking van methodieken

Het omvat de evaluatie en vergelijking van methodieken, het aftoetsen van bevindingen bij stakeholders en het formuleren van conclusies.

T4.1: Evaluatie en vergelijking van de verschillende methodieken:

  • evaluatie van zelfarchivering (voordelen en nadelen op het vlak van techniek, bv. schaalbaarheid, duurzaamheid), organisatie, (bv. mensen, financiële middelen), inhoud (bv. volledigheid)
  • evaluatie van de captatie van individuele accounts (aanpak fase 1 en fase 2)
  • evaluatie van de captatie van social media streams op basis van trefwoorden
  • vergelijking van deze methodieken
  • documenteren van de bevindingen en aanzet tot conclusies

T4.2: Aftoetsing van bevindingen in klankbordgroep

T4.3: Formuleren van conclusies

Resultaten

  • D5: Rapport betreffende met de evaluatie en vergelijking van methodieken

WP5: ontwikkeling van een duurzaam model voor de captatie en archivering van social media

Het omvat het in kaart brengen van mogelijke workflows of samenwerkingsmodellen voor captatie, het verder uitwerken van geprefereerde workflows en samenwerkingsmodellen en een bevraging van het brede veld betreffende de mogelijke uitrol van deze workflows en samenwerkingsmodellen.  

T5.1: In kaart brengen van workflows en samenwerkingsmodellen voor duurzame captatie met het oog op archivering:

  • in kaart brengen van relevante buitenlandse best practices voor duurzame captatie
  • brainstorm rond mogelijke modellen voor duurzame captatie

T5.2: Bevraging van het brede veld betreffende voorkeur en mogelijke deelname in samenwerkingsmodellen of workflows

T5.3: Uitwerken van geprefereerde workflows en/of samenwerkingsmodellen voor duurzame captatie met het oog op archivering

WP6: projectmanagement, communicatie en disseminatie

Het omvat de organisatie van de bijeenkomsten van de stuur- en klankbordgroep, de coördinatie van de verschillende betrokken partners, de projectadministratie, de communicatie over het project en het delen van de projectresultaten via diverse kanalen.

Resultaten

  • D7: eindrapport fase 2