Inhoud
Het web is het communicatiemiddel bij uitstek geworden wat het vanuit een erfgoedperspectief zeer waardevol maakt. Nochtans wordt over het algemeen weinig aandacht besteed aan het bewaren van deze inhoud. In vergelijking met andere Europese landen waar nationale archieven en bibliotheken al jarenlang bezig zijn met webarchivering, heeft België een grote achterstand opgelopen. Deze uitdaging willen het Rijksarchief en de Koninklijke Bibliotheek van België samen aanpakken. Het onderzoeksproject “Preserving Online Multiple Information : towards a Belgian strategy” (PROMISE) wil een federale strategie uitbouwen voor de bewaring van het Belgische web.
Het project zal eerst de internationale “best practices” voor webarchivering identificeren en op basis daarvan een strategie uitwerken voor webarchivering in België op federaal niveau. De partners in het project zullen een beleid uitstippelen en een methodologie bepalen voor de evaluatie en de selectie van de digitale inhoud die moet worden gearchiveerd. Ook het wettelijk en reglementair kader in België zal onder de loep worden genomen. Het onderzoeksteam zal vervolgens een pilootproject opzetten om Belgische websites te archiveren en toegang te verlenen tot de collecties.
De bevoegdheden van het Rijksarchief inzake webarchivering worden bepaald – en ingeperkt – door de archiefwet. Een website kan beschouwd worden als een archief aangezien hij bestaat uit een geheel van documenten en gegevens die gecreëerd werden in het kader van de activiteiten van een archiefvormer. De webarchiveringsactiviteiten van de Koninklijke Bibliotheek daarentegen kaderen in de wetgeving op het wettelijk depot. In deze context worden websites beschouwd als publicaties. Binnen het project PROMISE zullen aanbevelingen worden geformuleerd om de wet op het wettelijk depot uit te breiden en webarchivering erin op te nemen.
Het project is gestart op 1 juli 2017 en loopt tot december 2019.
Promisebot
Promisebot is de webcrawler of spider die gebruikt wordt in dit project.
Promisebot start het verzamelen van websites op basis van een lijst URL’s van webpagina’s. Bij het bezoeken van deze pagina’s detecteert Promisebot links (SRC en HREF) en voegt die toe aan de lijst met te verzamelen pagina’s.
Promisebot is herkenbaar aan het User-Agent veld in het HTTP request dat volgende waarde heeft: “Mozilla/5.0(compatible; promisebot/1.0 + https://www.kbr.be/en/promise-project)”. Promisebot gebruikt de volgende IP adressen en host names:
- 91.121.67.124 - ns301053.ip-91-121-67.eu
- 172.18.16.11 - ea06c202.private.ugent.be
- 193.191.148.229 - promise.ilabt.imec.be
Gelieve met ons contact op te nemen bij onverwacht gedrag via het e-mailadres webarchive@arch.be en de volledige User-Agent en indien mogelijk het IP-adres te vermelden.
Om te voorkomen dat Promisebot webservers te zwaar zou belasten, zou een server slechts bezocht worden in tijdsintervallen van een paar seconden. Door netwerkvertragingen zou dit tijdelijk wat kunnen afwijken.
Partners
Het project is een samenwerking tussen het Rijksarchief (Dienst Digitale Preservatie & Toegang), de Koninklijke Bibliotheek van België, de universiteiten van Gent (Research Group for Media, Innovation and Communication Technologies en Ghent Centre for Digital Humanities) en Namen (Research Centre on Information, Law & Society), en de Hogeschool Bruxelles-Brabant (Unité de Recherche et de Formation en Sciences de l’Information et de la Documentation).
Medewerkers
- Projectmedewerker Rijksarchief en Koninklijke Bibliotheek: Friedel Geeraert
- Co-promotoren en verantwoordelijken voor het Rijksarchief: Rolande Depoortere en Sébastien Soyez (Dienst Digitale Preservatie & Toegang)
- Co-promotoren en verantwoordelijken voor de Koninklijke Bibliotheek: Sophie Vandepontseele & Nadège Isbergue (Dienst Onderzoek & Innovatie)
- Projectmedewerker CRIDS UNamur: Alejandra Michel
- Co-promotoren en verantwoordelijken voor CRIDS UNamur: Cécile De Terwangne en Benoît Michaux
- Projectmedewerker UGent: Eveline Vlassenroot
- Co-promotoren en verantwoordelijken voor UGent: Peter Mechant (Research Group for Media, Innovation and Communication Technologies) en Sally Chambers (Ghent Centre for Digital Humanities)
- Co-promotor Hogeschool Bruxelles-Brabant: Emmanuel Di Pretoro (Unité de Recherche et de Formation en Sciences de l’Information et de la Documentation)
Nieuws
Op vrijdag 18 oktober 2019 nemen het Rijksarchief en de KBR je mee op sleeptouw in de complexe wereld van de webarchivering tijdens het colloquium ‘Saving the web: the promise of a Belgian web archive’. Registreren kan vanaf nu! Wacht niet te lang, want het is een 'hot item'...
Iedereen is wel bekend met de 404 HTTP response code, die aangeeft dat de webpagina die je had opgevraagd niet meer beschikbaar is. Dit is op zijn minst frustrerend, maar duidt ook op een onderliggend probleem: dagelijks gaat veel interessante informatie op het web verloren. Het Rijksarchief en de andere partners binnen het onderzoeksproject PROMISE buigen zich over deze problematiek. Het project werkt een federale strategie uit voor het archiveren van het Belgisch web.

Het web valt niet meer weg te denken uit het dagdagelijkse leven. Toekomstige historici zullen het leven anno 2018 niet kunnen reconstrueren zonder webarchieven. Meer en meer erfgoedinstellingen zijn bijgevolg bezig met de creatie van zulke archieven. In het kader van het PROMISE-onderzoeksproject, waaraan het Rijksarchief deelneemt, willen we peilen naar de noden van (toekomstige) gebruikers van webarchieven. Hoe zou jij deze bronnen willen raadplegen en gebruiken in de toekomst?
- Klik hier om deel te nemen aan de enquête (5-10 min.)
Links
Presentaties studiedag Saving the Web: the Promise of a Belgian Web Archive (KBR, 18/10/2019)
- National web archives: the land of promise for researchers - Prof. Dr Niels Brügger (Aarhus University)
- Introduction to the PROMISE project, best practices and the Belgian strategy - Sophie Vandepontseele (KBR); Friedel Geeraert (KBR/State Archives); Dr Peter Mechant (UGhent); Alejandra Michel (CRIDS - UNamur); Sébastien Soyez (State Archives); Dr Rolande Depoortere (State Archives)
- Technical aspects of the PROMISE project - Gerald Haesendonck (UGhent)
- Using web archives for researchers - Sally Chambers (GhentCDH and DARIAH); Eveline Vlassenroot (imec-mict-UGent); Patricia Blanco (MSc in Digital Humanities KU Leuven)
- Coordination of web archiving in The Netherlands - Jesse de Vos (Netherlands Institute for Sound and Vision, Netwerk Digitaal Erfgoed)
- Using Web archives for researchers : experience, challenges, issues – Prof. Dr Valérie Schafer (University of Luxembourg, C2DH)