Column: Technologische ontwikkelingen maken databestanden kwetsbaar

Datamanagement is regeringsakkoordwaardig, luidde de kop van een interview met Jaap van den Herik en Jan Odijk, programma­directeuren van respectievelijk Catch en Clarin-NL. Catch staat voor Continuous Access To Cultural Heritage en Clarin-NL voor Common Language Resources and Technology Infrastructure Nederland (nee, het is geen typefout, de Technology is in de afkorting echt weggemoffeld). Door Catch zijn methoden en technieken ontwikkeld om erfgoedcollecties toegankelijker te maken, zowel voor wetenschappers als voor het brede publiek. Clarin-NL zette oude gegevensbestanden om in nieuwe die voor langere tijd bruikbaar zouden blijven.

12 July 2016 15:10Gewijzigd op 16 November 2020 05:00

Het interview met Van den Herik en Odijk verscheen in het juninummer van het blad E-Data & Research. Dat is een nieuwsbrief voor gegevensbronnen die online beschikbaar worden gesteld. Zulke bronnen worden in de wetenschap steeds belangrijker. Zeker in de mens- en maatschappijwetenschappen zijn ze niet meer weg te denken. Daarom maken de twee geïnterviewden zich zorgen over de toekomst wanneer de overheid onvoldoende het belang van deze bronnen zou inzien en de financiering zou terugschroeven. Het liefst zouden ze de waarborg voor continuering in een toekomstig regeringsakkoord vastgelegd zien.

Van den Herik vertelt dat het voor de geesteswetenschappers wel even wennen was om samen te werken met informatici. Dat is voor deze projecten natuurlijk welk nodig. Programmeurs kunnen wel allerlei softwareprogramma’s in elkaar zetten om door databestanden te zoeken, maar de gebruikers zullen moeten aangeven wat ze nodig hebben. Die twee partijen spreken totaal verschillende talen.

In het project waarvan Odijk de leiding had, werkten taalwetenschappers en informatici samen. Daar merkte hij eenzelfde aarzeling bij de gebruikers. Gelukkig zijn er in elk gebied van de wetenschap voorlopers die de waarde van zo’n project inzien en bereid zijn de barrière te nemen en de samenwerking met informatici aan te gaan.

Catch en Clarin-NL zijn afgerond en hebben goede resultaten opgeleverd. Waarom dan die zorg om de toekomst? Het antwoord is: onderhoud. Software veroudert tegenwoordig snel.

Toen ik werkte aan de geschiedschrijving van het Philips Natuurkundig Laboratorium in Eindhoven trof ik in het archief allerlei oude apparaten aan die bewaard werden om oude bestanden af te kunnen lezen. Ook bijvoorbeeld microfiches worden allang niet meer gebruikt. Om microfiches toch nog te kunnen aflezen, moet je ten minste één leesapparaat bewaren. Wie ergens in een la nog oude 5¼- of 3½-inch floppen heeft, zal het probleem herkennen.

Soms vinden we de oude vorm zo bewarenswaardig dat we de afgedankte aflees­apparaten opnieuw gaan produceren, zoals de platenspeler. Al zijn we collectief allang overgegaan op de cd, lp’s kunnen nog steeds worden afgespeeld. De platenspeler is echter niet helemaal hetzelfde meer. Hij kan nu ook gebruikt worden om de lp te digitaliseren. Het is natuurlijk ook veel beter om al die gegevens om te zetten in vormen die nu afleesbaar zijn. Ooit stappen we weer af van formaten als jpeg, mp3 en flv. Steeds wanneer we overgaan op een andere standaard zal alles omgezet moeten worden.

Niemand zal betwisten dat het waardevol is dat dankzij projecten als Catch en Clarin-NL oude gegevens duurzaam en doorzoekbaar ter beschikking komen. Zeker voor christenen geldt dat de waarde van de traditie waaruit we voortgekomen zijn ons tot dankbaarheid stemt en ons daarom belangstellend maakt in het gebruik van bronnen uit die traditie. Verschillende reformatorische uitgevers zetten zich daar dan ook voor in.

Tegelijk laten de twee genoemde projecten iets zien van de kwetsbaarheid van de gegevens uit het verleden. Voor je er erg in hebt, zijn ze niet meer toegankelijk. Dat kan zijn omdat je de taal waarin ze geschreven zijn niet meer verstaat, maar ook doordat je helemaal geen toegang meer hebt tot de woorden of afbeeldingen. Omdat wetenschap tegenwoordig steeds intensiever gebruikmaakt van zulke gegevens uit het verleden, zien we hier ook weer iets van de kwetsbaarheid van wetenschap.

De toegankelijkheid van het Woord van God is gelukkig op een andere manier gewaarborgd. Hoewel ook hier de techniek een belangrijke rol speelt als het gaat om het beschikbaar stellen van teksten, is het de Heilige Geest Die de ware toegang tot de inhoud geeft. Die Geest veroudert gelukkig nooit. Hij is ongevoelig voor wisseling van technische standaarden. De Geest heeft Zijn eigen standaard, die duurzamer is dan welke menselijke standaard ook. Misschien dat het borgen van die standaard ook in een regeringsakkoord kan worden opgenomen.

Prof. dr. Marc J. de Vries is bijzonder hoogleraar reformatorische wijsbegeerte aan de Technische Universiteit Delft. Reageren? rubriekforum@refdag.nl

RD.nl in uw mailbox?

Ontvang onze wekelijkse nieuwsbrief om op de hoogte te blijven.

Hebt u een taalfout gezien? Mail naar redactie@rd.nl

Home

Krant

Media

Puzzels

Meer