Publicatie:Sociale media accounts archiveren met ArchiveWeb.page

Uit Cultureel Erfgoed Standaardentoolbox
Naar navigatie springen Naar zoeken springen


Samenvatting

In het kader van het project Best practices voor de archivering van sociale media in Vlaanderen en Brussel werden verschillende tools getest om socialemediaplatformen te archiveren. Deze handleiding beschrijft de tool ArchiveWeb.page voor het archiveren van sociale media.


Referentie
Titel Sociale media accounts archiveren met ArchiveWeb.page (Voorkeurstitel)
Locatie
Uitgever
Jaar van uitgave 2021
Rechten CC-BY-SA
Persistent ID


Disclaimer: Deze handleiding werd gemaakt in februari - juni 2021. Merkt u dat er iets niet werkt? Mail dan Nastasia Vanderperren


ArchiveWeb.page is een Chrome-extensie waarmee je de browser kan ombouwen tot een webarchiveringssysteem. Het is de opvolger van Webrecorder. Net zoals haar voorganger neemt ze een surfsessie op in het standaardformaat WARC. Terwijl je als gebruiker interageert met een webpagina in de surfsessie, downloadt ArchiveWeb.page alle content die je tegenkomt door het netwerkverkeer en de processen in je browser op te nemen. Daardoor is het gebruik van de tool tijdsintensief. Als je alle content van een sociale media account, zoals comments, wil capteren, zal je immers alle posts manueel moeten openen en de comments aanklikken.

Vereisten

  • Chrome browser;
  • een account op het socialemediaplatform.

Voordelen

  • kan gebruikt worden op Windows, macOS en Linux;
  • archiveert sociale media in het standaardformaat WARC;
  • archivering verloopt rechtstreeks in de browser;
  • kan ook gebruikt worden om de webarchieven af te spelen;
  • uitgebreide documentatie beschikbaar
  • creëert een minimale set van metadata die in het WARC-bestand bewaard worden, zoals gebruikte software, tijdstempel, URL en paginatitel;
  • heeft een autopilotfunctie voor Facebook, Twitter en Instagram.

Nadelen

  • tijdsintensief als je alle content van het socialemediaplatform wil capteren;
  • bepaalde elementen van facebook worden geblokkeerd, zoals het openklikken van foto's, waardoor ze niet in het webarchief opgenomen kunnen worden;
  • loopt vaak vast bij het scrollen doorheen Facebook. Dit is vermoedelijk een beperking die door Facebook opgelegd wordt.

Worfklow

Stap 1: installeer de software

ArchiveWeb.page is een Chrome-extensie die je installeert via de chrome web store.

  • Open Chrome.
  • Ga via deze link naar de extensie-pagina van ArchiveWeb.page en klik op Toev. aan Chrome.

Archiveweb 1.png

  • Er verschijnt een venster dat je vraagt om te bevestigen dat je de extensie wil toevoegen. Klik op Extensie toevoegen.

Archiveweb 2.png

  • Zet vervolgens de extensie vast door linksboven op het puzzelstukje te klikken en op het punaise-icoontje naast Webrecorder Archiveweb.page te klikken.

Archiveweb 3.png

  • De extensie staat nu in je browser naast de adresbalk.

Archiveweb 4.png

Stap 2: capteer het sociale media account

Na de installatie van ArchiveWeb.page kan je Chrome gebruiken als een webarchiveringstool.

  • Maak een collectie voor het account dat je wil capteren.
    • Klik hiervoor op het ArchiveWeb-icoon en klik op het dropdown-menu onder Record To’. Kies voor Create New Archive…

Archiveweb 5.png

  • En geef een naam aan de collectie.

Archiveweb 6.png

Archiveweb 7.png

  • Ga vervolgens naar het socialemediaplatform van het account dat je wil archiveren en log in.

Archiveweb 8.png

  • Navigeer naar het sociale media account dat je wil archiveren en start de opname. Klik hiervoor weer op het ArchiveWeb-icoon in de browser. Vink de optie Start With Autopilot aan en druk op Start.

Archiveweb 9.png

  • Nadat je op start gedrukt hebt, zal ArchiveWeb de pagina opnieuw laden en de content beginnen downloaden. De autopilotfunctie zal geautomatiseerd naar beneden scrollen, posts openen, comments openklikken en video's afspelen.

Archiveweb 10.png

  • Om ervoor te zorgen dat alle content bewaard wordt, moet je iedere post en foto openen en alle video’s afspelen. Bij Facebook worden niet automatisch alle comments getoond, dus ook deze zal je moeten uitklappen als je ze wil bewaren. Controleer ook of je alle comments ziet in plaats van enkel de relevante. Tijdens het uitvoeren van deze acties zal ArchiveWeb steeds meer content opslaan.
  • Als je de sessie wil beëindigen, klik dan terug op het ArchiveWeb.page-icoon en druk op Stop.

Archiveweb 11.png

Stap 3: exporteer het webarchief als WARC-bestand

Nadat ArchiveWeb.page het sociale media account gearchiveerd heeft, kan je het webarchief exporteren in WARC-formaat

  • Klik hiervoor weer op het ArchiveWeb-icoon en selecteer in het keuzemenu onder Record To de collectie die je in Stap 2 aangemaakt hebt.

Archiveweb 12.png

  • Druk vervolgens op Browse Archive. Je zal een lijst van pagina’s zien die je gearchiveerd hebt.

Archiveweb 13.png

  • Kies links voor Download en klik op Download All as WARC Only

Archiveweb 14.png

  • Sla het bestand op. Let op: ArchiveWeb.page wil het bestand opslaan als een .warc-bestand, maar het gaat om een gecomprimeerd (gzip) WARC-bestand. Voeg daarom .gz toe als extensie. Je kan dit ook achteraf na het downloaden aanpassen.

Webrecorder manual 15.png

  • Het webarchief is opgeslagen!

Resultaat

Het webarchief kan nu geopend worden WARC-players zoals ReplayWeb.page. Ga naar https://replayweb.page en open je WARC-bestand.

Webrecorder manual 17.png

Webrecorder manual 16.png

Uitbreiding

De archiveweb.page extensie auto-pilot functie moet soms wat geholpen worden. Vooral bij het automatisch scrollen. Het is ook mogelijk om met behulp van een javascript bookmarklet alle reacties op een facebook pagina of facebook groep uit te vouwen.

Simple Auto Scroll extensie

Gebruik een extensie in Chrome om automatisch te scrollen.

Ga naar https://chrome.google.com/webstore/detail/simple-auto-scroll/dccjkemhmffnljlnnoffljpkhkfpldff/related en klik "Add to Chrome" om Simple Auto Scroll toe te voegen aan Chrome.

Chrome install Simple Auto Scroll.png

Om Simple Auto Scroll te gebruiken, navigeer naar de te archiveren facebook/web-pagina en klik op het Simple Auto Scroll icoontje rechtsboven.

Simple Auto Scroll extensie activatie.png

Simple Auto Scroll heeft 3 scrol snelheden, 1 keer klikken gaat er voor zorgen dat de pagina traag naar beneden scrolt, 2 keer medium snelheid, 3 keer klikken is de snelste stand. Een vierde keer klikken zal het scrollen stoppen.

Of klik op de pagina om het scrollen te stoppen.

Om de scrol snelheid aan te passen open het context menu van de extensie, doe rechtermuisklik op het extensie icoontje.

Simple Auto Scroll.png

En selecteer "Opties".

Hoe hoger het cijfer hoe trager de scrol snelheid, de opties aanvaarden negatieve cijfers.


Simple Auto Scroll settings.png

Uitvouwen van facebook reacties

Om reacties op facebook automatisch uit te vouwen kan de "auto-scroll" bookmarklet gebruikt worden van Jens-Ingo Farley. Bookmarklets zijn kleine script uitbreidingen in de vorm van een bladwijzer balk knop. Meer informatie over bookmarklets https://support.mozilla.org/en-US/kb/bookmarklets-perform-common-web-page-tasks.


Ga naar http://com.hemiola.com/bookmarklet/ en sleep de "Expand-All" knop naar jouw bookmark balk van je browser.

Als de bladwijzer balk niet geactiveerd is gebruik de volgende sneltoets om die te activeren. Chrome of Chromium-based browsers: Ctrl+Shift+B

Vervolgens, ga naar de te archiveren facebook pagina of groep en klik op de "Expand All" knop in de bladwijzer balk.

Expand all process screenshot.png

Het process stopt vanzelf wanneer het einde van de pagina is bereikt. Of wanneer de gebruiker op de "esc" knop drukt.

De Expand all bookmarklet en de Simple Auto scroll extensie combinatie zijn een goed alternatief voor de auto-pilot functie van de archive.web extensie. Het is aan te raden om enkel het tablad met de te archiveren Facebook pagina of groep open te hebben in de browser. Zet de auto scroll snelheid niet te hoog zodat de archive.web extensie alle links kan archiveren. Gebruik een computer met genoeg RAM geheugen en een snelle internetverbinding.