Digibron biedt makkelijk toegang tot unieke content

Ingenieuze techniek maakt brochures, periodieken, kranten en tal van andere publicaties makkelijk doorzoekbaar. Digibron ontsluit op een laagdrempelige manier waardevolle bronnen uit de gereformeerde gezindte.

Pieter Ariese en Gijsbert Bouw
26 March 2011 07:14Gewijzigd op 14 November 2020 14:15
Beeld RD, Alex van Pijkeren
Beeld RD, Alex van Pijkeren

Met vereende krachten is de afgelopen twee jaar gewerkt aan de opbouw van het immense archief. Naar schatting bevat Digibron nu 246.000 pagina’s, ofwel maar liefst 1,2 miljoen artikelen.

Zo’n enorme digitale databank ontstaat niet van de ene op de andere dag, zegt projectleider Jan Reijnoudt. Voordat de papieren edities van De Saambinder en RMU Contact in het onlinesysteem terechtkwamen, zijn heel wat stappen gezet. „Maar juist door dat zorgvuldig en weloverwogen te doen, hebben we nu een systeem waarmee gebruikers met een paar muisklikken een schat aan informatie kunnen ontsluiten.”

De duizenden pagina’s zijn door een gespecialiseerd bedrijf gescand. Daarmee was het materiaal weliswaar gedigitaliseerd, maar nog verre van doorzoekbaar. Reijnoudt: „De volgende stap was het clippen: elk artikel moest digitaal ‘uitgeknipt’, om het op artikelniveau vindbaar en doorzoekbaar te maken.”

Al bij het clippen moet duidelijk zijn welke informatie waar staat: wat is de kop van het artikel, wat de auteursnaam, wat de aanhef? „Dat verschilt per publicatie; clippen is daardoor een nauwkeurig en tijdrovend proces.”

Hoe mooi het ook is al die informatie digitaal te hebben, ze moet vervolgens nog ontsloten worden. „We gebruiken software die de teksten intelligent analyseert. Maar je moet de software wel leren wat wat is. Dat is puur handwerk: dit is een naam, dat is een werkwoord, dit zijn namen van kerkverbanden. Noem maar op. Dat zijn processen die voortdurend bijsturing nodig hebben.”

Verschillende wegingsfactoren bepalen de uiteindelijke zoekresultaten. Reijnoudt: „Ook die factoren hebben we handmatig ingegeven. Hoe lang is een artikel, hoe vaak komt een bepaalde zoekterm voor, is het een interview of een analyse? Dat soort informatie bepaalt mede de relevantie van een artikel.”

Hoe zorgvuldig deze stappen ook zijn uitgevoerd, niet al het materiaal komt uiteindelijk feilloos in de database terecht, zeggen projectmedewerkers Bob Bremmer en Wessel Blokzijl. „Oude publicaties bevatten nogal eens spelfouten. Die haalt het systeem er niet uit, en dus zijn ze ook online zichtbaar. Bovendien, hoe verder je teruggaat in de tijd, hoe meer het bronmateriaal aan kwaliteit verliest. Daardoor herkent de software bepaalde tekens soms niet. En is menskracht nodig om correcties uit te voeren.”

Zo ploegde een team van zo’n twintig correctoren 25 jaargangen van het Reformatorisch Dagblad –alle kranten van vóór 1995– door op rare fouten. „Die oude kranten hadden nogal eens een wat vreemde opmaak, wat bij het clippen voor problemen zorgde.”

De enorme hoeveelheid werk heeft wel geresulteerd in een onuitputtelijke bron aan makkelijk doorzoekbare informatie. Digibron geeft primair zoekresultaten op relevantie: het artikel dat het meeste zegt over de ingegeven zoekterm verschijnt bovenaan. De gebruiker kan de zoekresultaten naar believen aanpassen. Het grootste artikel eerst, het oudste, of juist het meest recente.

Daarnaast biedt het systeem geavanceerde zoekopties, waarbij op meerdere zoektermen tegelijkertijd gezocht kan worden. Ook kan de gebruiker tal van sorteringen aanbrengen. Zo kan hij zoeken op jaartal, bron, auteur, genre, rubriek of op personen die in het artikel worden genoemd.

Een slimme rubricering maakt het systeem snel en een uitgebreide woordenlijst zorgt er voor dat Digibron ook artikelen vindt die synoniemen of associaties bevatten. Wie zoekt op ”avondmaal”, vindt zo ook de publicaties waarin over ”nachtmaal” wordt geschreven.

Hoe veelbelovend dat ook allemaal klinkt: wie zoekt op internet, denkt tegenwoordig alleen nog maar aan Google. Voegt Digibron eigenlijk wel zo veel toe? Reijnoudt: „Om te beginnen is het meeste materiaal uit Digibron niet via Google beschikbaar. Het gaat dus om unieke content. Zoeken in Google gaat primair op dezelfde manier, maar daar staat het gewenste zoekresultaat vaak tussen heel veel nutteloze informatie. Terwijl Digibron elk zoekresultaat in een bepaalde context plaatst. Waar Google geen duiding geeft, of vermengt met heel veel non-informatie, biedt Digibron die context juist wel: afgebakend en gemakkelijk doorzoekbaar.”

Door de breedte aan participanten kan Digibron met recht het kenniscentrum voor de gereformeerde gezindte worden genoemd, stelt Reijnoudt. „Dat levert voor de zoeker een schat aan informatie op. Heel concreet: zoekt iemand op orgaandonatie, dan kan hij vanuit de verschillende kerkelijke periodieken leren hoe dat thema op verschillende momenten in de tijd is beoordeeld. Omdat Digibron ook opinie- en onderwijsbladen en kranten bevat, kan hij het tegelijkertijd in de historische en maatschappelijke context plaatsen. Zo raakt de gebruiker met een paar muisklikken volledig geïnformeerd over onderwerpen die binnen de gereformeerde gezindte speelden en spelen.”

RD.nl in uw mailbox?

Ontvang onze wekelijkse nieuwsbrief om op de hoogte te blijven.

Hebt u een taalfout gezien? Mail naar redactie@rd.nl

Home

Krant

Media

Puzzels

Meer