‘We willen de Photoshop voor grote moleculen zijn’

Machine learning (ML), een technologie die vooral bekend is in de context van taalmodellen, kan de preklinische fase van medicijnontwikkeling 1,5 tot 10 keer versnellen. De modellen van biotech bedrijf Cradle helpen wetenschappers bij het ontdekken en ontwikkelen van biologics. Stef van Grieken, oprichter van Cradle: ‘We hebben de ambitie om de Photoshop voor grote moleculen te worden.’

Veel nieuwe en aankomende therapieën hebben ‘large molecules’, ofwel proteïnen als werkzame stof. Deze moleculen bestaan uit lange ketens van aminozuren, die in een haast eindeloos aantal combinaties kunnen worden gerangschikt. Dat maakt het een tijdrovende en kostbare uitdaging maakt om de juiste combinatie te vinden die effectief is voor een bepaalde behandeling. ‘Onze technologie kan het preklinische ontwikkelproces aanzienlijk versnellen en de kans op succes in klinische onderzoeken vergroten’, aldus Van Grieken.

Van Google naar Cradle

Voordat Stef van Grieken Cradle oprichtte, zat hij in het leadership team van Google Research. ‘Daar ontvouwde zich de revolutie van Machine Learning (ML) modellen die de taal van de mens begrijpen. Een ander team bij Google Research was op dat moment bezig om diezelfde techniek toe te passen op large molecules. Tot mijn grote fascinatie bleek die techniek net zo goed om te kunnen gaan met de taal van de biologie. Ik zag de potentie van deze technologie voor het ontwikkelen van zowel medicijnen als duurzame chemische producten, voedsel en materialen.’ Vooral het idee dat ML de preklinische fase van medicijnontwikkeling aanzienlijk kan versnellen, motiveerde hem een kleine drie jaar geleden om de sprong te wagen en Cradle op te richten.

Moleculen ontwikkelen

Cradle richt zich op de fase waarin de preklinische onderzoeken beginnen. ‘Onze software biedt wetenschappers de mogelijkheid om proteïnen te ontwerpen die beter presteren in termen van effectiviteit, veiligheid en produceerbaarheid’, legt Van Grieken uit. ‘Dit kan de tijd die nodig is om een molecuul te optimaliseren drastisch verkorten. Met de conventionele methoden duurt die fase zo’n 3 tot 5 jaar. Met toepassing van onze software kunnen we dat terugbrengen naar zo’n 12 tot 18 maanden.’ Inmiddels zijn er ongeveer 25 moleculen ontwikkeld met de modellen van Cradle voor grote geneesmiddelenbedrijven, waaronder Johnson & Johnson.

Vroeg in de adoptiefase

Hoewel de toepassing van ML bij medicijnontwikkeling veelbelovend is, bevindt de technologie zich nog in de early adaptor fase. ‘Bij de komst van elke nieuwe technologie is er in het begin terughoudendheid. Accountants waren in eerste instantie sceptisch over spreadsheets. En fotografen over de komst van digitale fotografie. Pas nadat zij ermee gingen werken, en ervaarden hoe leuk en efficiënt het was, gingen ze het omarmen.’

Die terughoudendheid bemerkt Van Grieken nu ook. ‘Het proces van medicijnen ontwikkelen is al enorm risicovol. Een experiment in de preklinische fase duurt gemiddeld ongeveer drie maanden en kan tonnen tot miljoenen kosten. Voeg je daar een nieuwe en onbekende technologie als machine learning aan toe, dan wil je wel enige zekerheid hebben dat het ook wat oplevert. Het is begrijpelijk dat bedrijven daarmee willen wachten tot er meer wetenschappelijk bewijs voor deze technologie is.’

Regelgeving en data

Andere obstakels die maken dat de technologie nog in zijn kinderschoenen staat, zijn de regelgeving en data. ‘De huidige regels zijn er om goede redenen. Een regel bij de ontwikkeling van antilichamen bijvoorbeeld, is dat je ze moet humaniseren. Dat wil zeggen dat je moet onderzoeken of de mutaties in je ontworpen molecuul ook al eens in mensen zijn voorgekomen. Die regel is bedoeld voor de veiligheid. Inmiddels zijn er slimmere en betere manieren om te onderzoeken of een aangepast molecuul een ongewenste immuunreactie veroorzaakt, met taalmodellen bijvoorbeeld. Maar daar is de regelgeving nog niet op aangepast.’

Daarnaast vormen data een groot obstakel. Ten eerste laat de kwaliteit van data nogal eens te wensen over. Van Grieken: ‘Vaak worden data nog met de hand ingevoerd, wat er voor kan zorgen dat mensen een verkeerde waarde invoeren. Soms betekent het ook dat foutieve metingen worden ingevoerd die niet goed worden gecontroleerd. Daarmee verwar je een machine learning model.’ Ten tweede is de data verre van compleet. ‘De dekkingsgraad van menselijke taal in taalmodellen is bijvoorbeeld heel hoog. Het meeste is al eens opgeschreven op het internet. Dat geldt absoluut niet voor de dekking van de biologie; daar is de dekkingsgraad juist laag. Dat komt onder meer doordat lang niet alle data uit wetenschappelijke studies openbaar wordt gemaakt; het zit verstopt in laboratoria’, vervolgt Van Grieken. En tot slot zijn er onvoldoende goede benchmarks. ‘Een groot deel van ons werk bestaat eruit dat uit te vogelen. We investeren veel tijd en geld om datasets te maken op basis waarvan onze modellen over biologie kunnen leren.’

Razendsnelle ontwikkeling

Ondanks de obstakels van regelgeving en data gaan de ontwikkelingen op het gebied van Machine Learning razendsnel. Van Grieken raadt iedereen aan om met nieuwe technologieën te gaan experimenteren en te leren hoe je ze kunt toepassen. ‘De revolutie is niet te stoppen. En de effectgrootte is enorm: sommige processen kunnen wel 10 keer sneller gaan. Ga je er nu niet mee aan de slag, dan loop je in korte tijd mijlenver achter op concurrentie die er wél mee experimenteren.’

Doordat de technologieën processen efficiënter, minder risicovol en goedkoper kunnen maken, verwacht Van Grieken ook dat er meer kleinere bedrijven de stap zullen durven zetten om medicijnen te gaan ontwikkelen. ‘Dat vind ik persoonlijke een mooi vooruitzicht. Voor een flink aantal aandoeningen zijn er nog geen behandelingen of behandelingen die écht genezen. Die extra slagkracht om nieuwe medicijnen te ontdekken en ontwikkelingen kan veel goeds voor patiënten gaan betekenen.’

Keynote spreker LDDC

De potentie van Artificial Intelligence voor de ontwikkeling van medicijnen staat centraal op het derde Leiden Drug Development Conference, dat op 19 september plaatsvindt. Stef van Grieken verzorgt de keynote lezing, samen met Herman van Vlijmen (Global Head Computer-Aided Drug Design bij Johnson & Johnson en buitengewoon hoogleraar in Computational Drug Discovery aan het LACDR, Universiteit Leiden). ‘We gaan proberen aan het publiek uit te leggen wat feit is en wat fictie is ten aanzien van machine learning learning voor medicijnontwikkeling.’