Software van Genalice verwerkt supersnel DNA-data
Geen afgestudeerde biologen, maar softwareprogrammeurs hebben de snelheid van DNA-onderzoek in een stroomversnelling gebracht. Twee ict’ers uit Harderwijk braken een record door 42 menselijke genomen in bijna 18 uur te verwerken. Dat kost normaal minstens 42 dagen.
Het lijkt een wat eenvoudig kantoor aan de Deventerweg in Harderwijk. Op de gevel staat in grote letters Genalice, de naam van het bedrijf van oprichters Bert Reijmerink en Hans Karten. In dat kantoor werd vorige week geschiedenis geschreven.
Nee, geen cameraploegen voor de deur, want het „voorbewerken van de data van 42 menselijke genomen”, zegt eigenlijk maar weinig mensen wat. Maar wat bij het Harderwijkse Genalice wordt gepresteerd, is toch een doorbraak van wereldformaat op het gebied van DNA-onderzoek. Waar de snelste en grootste computers tot nu een dag nodig hadden om de puzzelstukjes van het DNA van één persoon op het juiste plekje te leggen, doet een simpele computer bij Genalice dat in ongeveer 25 minuten. Een doorbraak.
Puzzelstukjes
En het is niet eens zo moeilijk uit te leggen voor Harderwijker Bert Reijmerink, samen met compagnon Hans Karten de oprichter van het bedrijf.
„Het is heel goed te vergelijken met een puzzel. Neem 10.000 puzzels van 1000 stukjes en gooi alles op een hoop. En probeer daar maar weer 10.000 hele puzzels uit te krijgen. Eigenlijk is dat wat we nu in twintig minuten kunnen.”
Hans Karten ontwierp een softwareprogramma om al die kleine puzzelstukjes weer netjes in een lijn te krijgen, het zogenaamde ”alignment”. Waar tot nu toe enorme rekenkracht voor nodig was, lukte het de Harderwijkers om software te ontwikkelen die deze puzzel in een handomdraai legt.
DNA, voor de meeste mensen is het wel bekend dat het een blauwdruk van het menselijk lichaam bevat. Het bestaat uit de bouwstenen van de fysieke werkelijkheid. Alles wat groeit onder het licht van de zon, heeft DNA: planten, dieren en mensen. En sinds een aantal jaren is de mensheid vrij goed geworden in het lezen van die blauwdruk en ook in het ontdekken van foutjes in de blauwdruk waardoor ziektes kunnen ontstaan. De toepassingen zijn ongelimiteerd, en daaruit is de ethische discussie ontstaan over genetische manipulatie. Iets waar Genalice zich verre van houdt.
„Hans en ik komen uit de ict-wereld”, zegt Reijmerink. „Eigenlijk wisten we tot drie jaar geleden helemaal niets van de biomedische wereld. Maar we weten wel hoe je enorme hoeveelheden data snel kunt verwerken. Dat is de specialiteit van Hans en dat heeft hij jaren bij het grote ict-bedrijf Oracle gedaan. Wij kwamen via een hoogleraar en oncoloog aan de Erasmus Universiteit in Rotterdam in aanraking met de verwerking van DNA-gegevens. Hij legde ons het probleem voor dat DNA wel te lezen is, maar dat het daarbij om enorm grote bestanden ging, waar maar moeilijk mee te werken viel. Om kanker te bestrijden of de oorzaak van kanker te ontdekken, hebben ze een veel snellere verwerking van die gegevens nodig en moeten die gegevens makkelijker kunnen worden vergeleken. Dat motiveerde ons om hiermee aan de slag te gaan.”
Hoeveelheid data
„Het grote probleem is de enorme hoeveelheid van alle data”, zegt Reijmerink. „Het proces van het analyseren van DNA gaat in een aantal stappen. Als eerste wordt het DNA gedigitaliseerd. Dat gebeurt door een haartje of een bloeddruppel in miljoenen stukjes te schieten en elk deeltje met chemicaliën te bewerken en vast te leggen. Dat wordt dan samengevat in stukjes met de letters ACTG. Hoe ze dat precies doen, moet je mij niet vragen, dat is de kunst die de biomedische mensen onder de knie hebben. Een DNA-streng van een mens bestaat uit 3 miljard deeltjes. Wij weten met onze software al die stukjes weer relatief snel in de juiste volgorde te leggen, waar andere bedrijven daar 24 tot 36 uur over doen.”
Reijmerink en Karten stuitten op veel ongeloof, juist vanuit de biomedische wereld. „Ik begrijp het wel, twee ict’ers die zeggen een oplossing te hebben voor dé bottleneck in het DNA-onderzoek. Maar eigenlijk is het logisch dat de oplossing van deze kant komt, en niet uit de biomedische wereld zelf. Er is ooit onderzoek gedaan naar waar een bioloog precies zijn tijd aan besteedt. Uit dat onderzoek bleek dat deze maar 20 procent van zijn tijd steekt in onderzoek zelf, een belangrijk deel van de overige tijd zit in het bedenken van manieren om de onderzoeksdata te verwerken en te analyseren. Het is belangrijk dat onderzoekers zich volledig op hun specialiteit kunnen richten: onderzoeken en analyseren.”
Patiëntengroepen
De volgende stap in de DNA-analyse is het linken van alle DNA-data aan medische gegevens van grote patiëntengroepen.
„Ook daar hebben we een enorme stap in gemaakt”, vertelt Reijmerink. „Wij hebben de waarde van deze technologie kunnen aantonen door een eerder gedaan onderzoek bij het Erasmus MC te reproduceren met onze software en de uitkomsten te vergelijken. De biomedische wetenschappers hadden voor dit onderzoek gebruikgemaakt van een rekencentrum in Amsterdam, waar 200 processors gedurende 5 dagen hebben staan rekenen om tot resultaat te komen. Met onze software zijn we in staat geweest om met de rekenkracht van slechts enkele processors hetzelfde resultaat binnen een paar seconden op het scherm te krijgen. Dit product wordt halverwege 2014 gelanceerd.”
Spannend
Drie jaar alleen maar investeren, betaalt zich nu uit voor Reijmerink en Karten. „Het was soms spannend”, zegt Reijmerink. „Ik heb me weleens flinke zorgen gemaakt over hoe we de salarissen van onze werknemers moesten betalen. Uiteindelijk werd hierin steeds weer voorzien.
We hadden ook voor het snelle geld kunnen kiezen, in bijvoorbeeld het bestrijden van cybercriminaliteit. In de branche waar we nu zitten, gaat het allemaal beduidend langzamer, maar dit werk geeft veel meer voldoening. Met de lancering van dit product hebben we een eerste stap gezet in onze bijdrage aan het krijgen van greep op complexe ziektes zoals kanker. Dat is uiteindelijk waar we het voor doen.”