Uitdijende informatiebrij hanteerbaar met algoritmen
Aanbevelingen op websites, adviezen over de snelste route en alleen nog relevante informatie. Algoritmen zijn overal. Maar ze blijken niet onfeilbaar.
Het winkelmandje van bol.com bevat maar één product. Toch staan eronder aanbevelingen die naadloos aansluiten bij het artikel waar zojuist de keuze op is gevallen: accessoires, maar ook concurrerende producten met soortgelijke kenmerken. Bij elkaar gerekend door een algoritme – een slimme formule die ons kijk- en koopgedrag heeft gecategoriseerd op basis van een enorme brij gegevens.
De webwinkel is bepaald niet de enige die ‘relevante’ resultaten bij elkaar rekent. Het algoritme van Google bepaalt bijvoorbeeld welke resultaten belangrijk zijn voor een gebruiker. Zonder algoritme zouden de tijdlijnen van Facebook en Twitter veel oninteressante informatie bevatten. In het bigdatatijdperk lijkt het algoritme relevanter dan ooit.
Stapsgewijs
„Een algoritme is niets anders dan een systematische manier om iets te berekenen”, legt Hans Bodlaender, hoogleraar informatica aan de Universiteit Utrecht, uit. Algoritmen zijn dan ook stappenplannen met acties die een bepaald probleem oplossen of een specifieke taak uitvoeren. De uitkomst van de ene stap kan de basis vormen voor de volgende stap.
Algoritmen bestaan al veel langer dan computers. De term zelf wordt ontleend aan de Perzische wetenschapper Muhammad ibn Musa al-Chwarizmi (780-850).
Een oud voorbeeld van een algoritme is de zeef van Eratosthenes,genoemd naar een Griekse wiskundige. Daarmee kunnen stapsgewijs alle priemgetallen worden gevonden die kleiner zijn dan een willekeurig gekozen getal. Een priemgetal is alleen deelbaar door zichzelf en door 1.
Het algoritme van de zeef werkt als volgt. In een lijst van alle hele getallen tussen 2 en het gekozen getal omcirkelt Eratosthenes het getal 2. Vervolgens streept hij alle veelvouden van 2 door. Als derde stap gaat hij op zoek naar het eerste getal op de lijst dat niet is omcirkeld of doorgestreept – dat is dus een priemgetal. Het proces stopt als zo’n getal niet meer voorkomt in de lijst. Bestaat zo’n getal nog wel, dan omcirkelt Eratosthenes dit (stap twee) en streept hij alle veelvouden van dit getal door. Net zo lang tot stap drie geen nieuw getal meer oplevert.
Het voorbeeld laat zien dat het voor de uitkomst niet per se nodig is om te begrijpen wat het algoritme doet.
Strengheid
In 1842 beschrijft de Britse wiskundige Ada Byron het eerste algoritme dat specifiek voor computers was bedoeld. Toch lopen wiskundigen en logici tot begin twintigste eeuw ermee vast dat de definitie van een algoritme wiskundige strengheid mist.
Dat probleem lost de Britse wiskundige Alan Turing in 1936 grotendeels op met de beschrijving van de zogeheten turingmachine. Aanvankelijk gaat het om een gedachte-experiment, een ‘computer’ die alleen in het brein van de bedenker bestaat. Goede algoritmen kunnen worden toegepast in een turingmachine of iets wat daarop lijkt.
Dat algoritmen ondanks hun geschiedenis juist recent steeds meer aandacht krijgen, komt vooral door de praktische toepassing ervan, vertelt Bodlaender: „Elk computerprogramma en elke app zit er vol mee. Voor alles wat wordt berekend, wordt een methode gevolgd. Als we een e-mail sturen, is er een algoritme dat ervoor zorgt dat die op de juiste plaats terechtkomt. Bij het spelen van een computerspel zorgen algoritmen ervoor dat we de juiste plaatjes op ons scherm zien. En in de routeplanner in onze auto zit een algoritme dat de kortste route uitrekent.”
Ondanks de uiteenlopende toepassingen hebben ze allemaal dezelfde basiskenmerken, die informaticus Donald Knuth op een rijtje heeft gezet: een algoritme moet ondubbelzinnig zijn, ergens beginnen en eindigen en in principe ook door een mens kunnen worden uitgevoerd.
Hoofdrol
Vandaag de dag worden er tientallen soorten algoritmen onderscheiden. Er is echter geen consument die zich daarover druk maakt. Zelfs de meest complexe formules worden automatisch uitgevoerd, zonder dat gebruiker te maken krijgt met ingewikkelde sommen en berekeningen. Gebruiksvriendelijke, fraai ogende programma’s en apps onttrekken in nagenoeg elke toepassing de ingewikkelde logica aan het oog.
Toch lijken algoritmen vooral een hoofdrol te spelen op internet. Aan de hand van gebruikersgegevens berekenen algoritmen in toenemende mate welke informatie relevant is. De uitkomsten daarvan kunnen per internetgebruiker verschillen.
Op sociale media bepalen algoritmen bijvoorbeeld wat een gebruiker wel of niet ziet. Zoekmachines plaatsen sommige resultaten bij gebruiker A hoger in de lijst dan bij gebruiker B. Dat doen ze niet voor niets. Als een gebruiker alleen relevante inhoud ziet, neemt de waardering voor het medium toe en zal hij vaker terugkeren. Daarmee vergroten de websites hun eigen relevantie en zijn ze een interessantere doelgroep voor potentiële adverteerders. Bezoekers worden op hun beurt continu gevoed met informatie, waardoor ze blijven ‘hangen’ en niet overstappen naar een concurrerende dienst.
Doordat de invoer van algoritmen continu verandert, staat ook de uitvoer niet vast. Daardoor blijven websites relevante informatie weergeven, ook als de voorkeuren en interesses van een gebruiker veranderen.
Ingrijpend
Dat een algoritme bepaalt op welke informatie een bezoeker blijkbaar zit te wachten, heeft ook schaduwzijden. Algoritmen kunnen bijvoorbeeld een verkeerde inschatting maken of alleen nog eenzijdige informatie presenteren, waardoor gebruikers voortdurend worden bevestigd in hun vermoedens, gedachten en ideologieën.
Daardoor ontstaat er vanzelf een zogeheten informatiebubbel: een soort digitale stolp waar tegengeluiden uit worden gefilterd omdat die volgens het algoritme niet relevant zijn. Uiteindelijk versterkt het algoritme de gebruiker in zijn eigen gelijk.
Sociale media adviseren gebruikers bijvoorbeeld accounts te volgen die mogelijk interessant zijn op basis van andere accounts die zij volgen. Als gebruikers die suggesties opvolgen, kan dat resulteren in een tijdlijn met nog meer eenzijdige berichtgeving en opinies.
Onfeilbaar
Algoritmen zijn niet onfeilbaar, benadrukt Bodlaender. „Natuurlijk kan de programmeur een fout maken, of de hardware waarop het programma of algoritme draait stuk zijn gegaan. Een algoritme kan daarnaast in een onjuiste situatie worden toegepast; denk bijvoorbeeld aan een routeplanner die een route voor een auto geeft terwijl je op de fiets zit.”
Bij algoritmen op neurale netwerken zijn de mogelijke fouten zelfs nog groter. Dat zijn netwerken die met kunstmatige intelligentie leren aan de hand van voorbeelden. Bodlaender: „Als een algoritme van een beperkt aantal voorbeelden moet leren, kan het netwerk iets anders hebben geleerd dan de bedoeling was. Als je een netwerk wilt leren wat een koe is, maar alle getoonde voorbeelden uit koeien of spinnen bestaan, zal het algoritme daarna waarschijnlijk alle dieren met vier poten als koeien classificeren.”
In de praktijk kan dat ingrijpende gevolgen hebben. Bodlaender: „Stel dat een bank een hypotheeksysteem op basis van een neuraal netwerk gebruikt. Dat systeem heeft geleerd wie de lening terugbetaalt. Wat betekent dit als het systeem over een nieuwe klant voorspelt dat deze niet kredietwaardig is? Misschien behoort de klant op basis van kenmerken zoals postcode, leeftijd, geslacht, ras of opleiding tot een groep waarvan meerdere personen de hypotheek niet aflossen. Of heeft de klant pech gehad vanwege de voorbeelden die door het systeem werden aangeleerd. Het is mogelijk dat het systeem onbedoeld discrimineert.”
Antivax-algoritme
Een recent voorbeeld van ethiek en algoritmen is de kwestie rond de boeken over vaccinatie bij bol.com. Daarover is een discussie ontstaan doordat onder de zoekterm ”vaccinatie” boeken tégen vaccinaties hoger worden geplaatst dan boeken waarin vaccinatie wordt gepromoot. „Los van de discussie over vaccinatie is het interessant dat bol.com niet ingaat op de ethische discussie, maar stelt dat deze boeken door een algoritme gevonden werden”, vindt Hans Bodlaender, hoogleraar informatica aan de Universiteit Utrecht.
De zoekresultaten maken inderdaad de nodige reacties los. „Bol.com is niet neutraal”, schrijft redacteur Piet de Jong van het Nederlands Dagblad in een commentaar. Staatssecretaris Blokhuis (Volksgezondheid) laat aan het Algemeen Dagblad weten dat de webwinkel de „omstreden publicaties op zijn minst uit de etalage moet halen.”
Bol.com geeft aan dat de lijst met zoekresultaten automatisch wordt samengesteld. Het bedrijf begrijpt dat de boeken ter discussie staan, maar vindt het niet aan zichzelf „om te bepalen wat goed en fout is.” Het bedrijf is dan ook niet van plan om het algoritme aan te passen.
Racistisch algoritme
Gezichtsherkenningstechnologieën en algoritmen zijn racistisch, stelde Alexandria Ocasio-Cortez in januari. De kersverse Democratische senator uit Amerika struikelde over ”raciale ongelijkheden”. Die ontstaan doordat algoritmen nog steeds door mensen worden gemaakt en nog steeds zijn gebaseerd op menselijke veronderstellingen. „Als je de vooroordelen in geautomatiseerde veronderstellingen niet oplost, automatiseer je de vooroordelen.”
Hans Bodlaender, hoogleraar informatica aan de Universiteit Utrecht, onderkent het probleem: „Het is mogelijk dat het gebruik van sommige algoritmen betekent dat mensen niet worden beoordeeld op grond van hun eigen situatie en persoon, maar op grond van de etnische, sociale, politieke of religieuze groep waartoe ze behoren.”
Dat komt volgens hem niet in de eerste plaats door het algoritme, maar door de manier waarop het wordt gebruikt. „Het gebruik van algoritmen kan in sommige gevallen tot discriminatie leiden. Maar het zijn de mensen die discrimineren, niet de algoritmen. Die hebben geen mening, ras of politieke voorkeur.”