Koninklijke Bibliotheek bewaart websites voor het nageslacht
Morgen kan een stukje cultureel erfgoed hopeloos verloren zijn. Dat realiseert Peter de Bode (56) zich wanneer zijn oog valt op een bushokje. Onder de reclame-uiting wordt een website vermeld. Direct prent hij de URL in zijn geheugen. Straks even checken of die website al in ‘zijn’ archief zit!
Kennis- en cultuuruitingen zijn in de digitale wereld van vandaag allang niet meer voorbehouden aan boeken alleen. Vorige week las De Bode op een ochtend dat afvalverwerker Van Gansewinkel gaat fuseren. „Dat betekent dat de website verdwijnt”, schoot het automatisch door zijn hoofd. „Ik heb die website meteen geselecteerd. Want als over twintig jaar iemand aan mij vraagt: Vertelt u eens iets over afvalverwerking in de laatste decennia, dan moet ik de site van Van Gansewinkel kunnen laten zien.”
De Bode coördineert het webarchief van de Koninklijke Bibliotheek (KB). In een ietwat krap kantoor legt de coördinator van het webarchief uit wat hij doet en vooral ook, waarom. Want niet alleen de website van de afvalverwerker is in het archief beland, ook de puntenslijperverzamelingssite van twee hobbyisten is veilig opgeslagen binnen de muren van de KB.
Serieuze bibliotheek
Hoe reageerden Nederlanders op fora op de dood van Fortuyn? Welke complottheorieën werden er in de eerste uren na de aanslag geboren op internetfora? Hoe reageerden overheidsinstanties in eerste instantie? En hoe voelden Nederlanders zich op 11 september 2001, direct na de aanslag op de Twin Towers? We zullen nooit een compleet beeld kunnen krijgen, omdat de KB pas in 2007 is begonnen met het webarchief. En dat betreurt De Bode.
Er is niets zo veranderlijk als het web. Dagelijks verschijnen en verdwijnen er websites. Informatie op een bestaande webpagina kan eenvoudig worden aangepast. De eerdere informatie gaat verloren. En met de huidige wetgeving is slechts een fractie van het web te redden.
Officieel is het geen taak van de KB om het web te archiveren. Maar een nationale bibliotheek die zichzelf serieus neemt, probeert het in ieder geval. De Bode: „Want cultureel erfgoed, dat is wat wij als Nederlanders doen. En ik wil graag dat de informatie over ons digitale gedrag ook voor toekomstige generaties beschikbaar is.”
Goudmijn
Het zijn niet langer enkel de miljoenen boeken uit of over Nederland die de prestigieuze bibliotheek wil hebben. Iedere website die van Nederlanders is of over Nederland gaat, moet worden opgeslagen, stelt de instelling in haar beleidsplan ”De kracht van het netwerk”. De Bode: „We krijgen hier geen extra subsidie voor.”
Op dit moment zijn zo’n 11.600 websites veilig opgeslagen in het systeem van de KB. Een kwart van de websites die tien jaar geleden nog bestonden, is uit de lucht. Zoals de website van de puntenslijpersverzameling. De website van de Stichting voor Reformatorische Wijsbegeerte verdween in 2010. De website van V&D ging na het faillissement van het warenhuis op zwart.
Al die websites bevinden zich nog wel in het archief van de KB. Is het echt de moeite waard om een website van een warenhuis op te slaan? Volgens De Bode is het een goudmijn voor onderzoekers. „Het geeft antwoord op vragen als: Wat voor spullen kocht Nederland in 2015, wat waren typische V&D-producten, wat was er in de mode? En wat was het Prijzencircus ook alweer?”
Ufo’s
Archiveren blijft mensenwerk. Collectiespecialisten dragen websites en onderwerpen aan die het volgens hen waard zijn om te archiveren. Onlangs realiseerde De Bode zich dat hij nog geen oog had gehad voor websites met complottheorieën. Dus struint hij nu internet af naar dat type sites. Voor zijn neus heeft hij een website over ufo’s. Die moet ook in het archief, meent hij. „Ons nageslacht kan ons verwijten dat we de verkeerde keuzes maakten met archiveren. Maar ze kunnen ons niet verwijten dat we niets hebben gedaan.”
Voor sommige onderwerpen heeft de collectiespecialist speciale aandacht. Tientallen websites over kloosters bevinden zich bijvoorbeeld in het archief. „Hun rol in de samenleving verandert, dus dan is het mooi om dat vast te leggen.” Ook archiveert hij enkele honderden Friese websites. Historische onderwerpen en overheidswebsites zijn sowieso sterk vertegenwoordigd.
De ruim 10.000 websites zijn slechts een fractie van het hele Nederlandse internet. In ons land zijn zo’n 5,6 miljoen domeinnamen geregistreerd. Het liefst zou de Koninklijke Bibliotheek ál die websites kopiëren, zoals de Britse nationale bibliotheek al wel doet. „Maar die hebben daar wél eerst tien jaar voor gelobbyd. Wij moeten daar nog mee beginnen. Dat is politiek. Ingewikkeld dus.”
Protest
De Bode zou graag .nl-websites automatisch opslaan De huidige wetgeving maakt ”domain crawling” echter onmogelijk. Onterecht, vindt de collectiespecialist. „Alles wat je online zet is openbaar voor iedereen. Waarom zou je daar dan geen kopie van mogen bewaren? En de meeste beheerders reageren alleen maar enthousiast wanneer ze horen dat hún website in het webarchief van de KB komt.”
De Bode moet op dit moment iedere websitebeheerder na de mededeling dat zijn site in principe wordt opgenomen in het webarchief, vier weken de tijd geven om protest aan te tekenen. Die individuele benadering kost veel tijd.
Op dit moment is het webarchief –eveneens vanwege wetgeving– alleen te raadplegen vanuit de KB. „Anders zouden we informatie van anderen herpubliceren”, legt De Bode uit. Het archief zou eigenlijk vanaf elke computer toegankelijk moeten zijn, vindt De Bode. Ook daarvoor wil hij lobbyen.
Toegang tot alle kennis
Het webarchief van de Koninklijke Bibliotheek is nu 24 terabyte – circa 24 miljard megabyte – groot. Nu.nl wordt het vaakst opgeslagen in het archief, iedere dag. De website rijksoverheid.nl is het grootste. Het kost de robot van de KB een aantal dagen om alle 271.000 URL’s van deze website te bezoeken en te kopiëren.
Overigens valt de Nederlandse collectie in het niets bij de omvangrijke collectie van haar internationale broer het Internet Archive. Die organisatie uit San Francisco heeft op dit moment 487 miljard webpagina’s opgeslagen.
Het archief op wereldschaal groeit maandelijks harder dan de omvang van de volledige collectie van de Koninklijke Bibliotheek. In tegenstelling tot de werkwijze van de KB kopieert het Internet Archive websites zonder toestemming van de eigenaar.
Het Internet Archive werd opgericht in 1996 en is gehuisvest in een kerk. Het doel van de non-profitorganisatie is alle wereldburgers toegang te bieden tot alle menselijke kennis.