Hopp til innhold
International Parkinson and Movement Disorder Society

Kunstig intelligens i legemiddelutvikling

AI i Drug DiscoveryDato: juni 2020
Utarbeidet av SIC-medlem: Lorraine V. Kalia, lege, PhD
Forfattere: Igor Jurisica, PhD, DSc; Alix Lacoste, PhD
Redaktør: Un Jung Kang, MD

Kunstig intelligens (KI) omfatter teorien, utviklingen og anvendelsen av datasystemer som kan lære, forbedre ytelse og utføre oppgaver knyttet til menneskelig intelligens, som å spille sjakk eller Go, gjenkjenne komplekse mønstre i ulike data, inkludert bilder og sekvenser av strenger, gjenkjenne tale og språk, og støtte komplekse beslutningsprosesser. Denne menneskelignende beslutningstakingen fra datamaskiner begynner allerede å forandre hvordan vi diagnostiserer menneskelig sykdom (f.eks. 1,2). Like (eller mer) spennende er potensialet ved å anvende KI med «big data» innen legemiddelutvikling, spesielt for nevrologiske lidelser uten sykdomsmodifiserende terapier som Parkinsons sykdom. Her spurte vi to eksperter innen KI, en fra akademia (Dr. Jurisica) og en fra industrien (Dr. Lacoste), om å diskutere rollen de ser for KI i legemiddelutvikling.   

Hvordan kan kunstig intelligens brukes til legemiddelutvikling?

Dr. Jurisica

Det er viktig å erkjenne at den generelle suksessen til bruken av AI avhenger av algoritmen, dataene og prosessen – å undervurdere noen av disse tre komponentene vil i beste fall resultere i en suboptimal løsning, og i verste fall fullstendig fiasko. Legemiddelutvikling bruker mangfoldige data, robotscreening, omfattende mønstergjenkjenning, prosessoptimalisering og mangesidig beslutningstaking, organisert i rike arbeidsflyter og pipelines. Det finnes flere muligheter for ulike AI-algoritmer for å hjelpe og forbedre mange av disse trinnene.

Legemiddelutviklingsprosessen starter med å identifisere mulige interessante mål ved å analysere rike, multiomiske datasett og finne nyttige ikke-trivielle mønstre – biomarkører og mulige legemiddelmål. Etter hvert som antallet ressurser reduseres og kostnadene øker, dekker prosessen høykapasitetsscreening for mulige molekyler, identifisering og optimalisering av potensielle legemidler, preklinisk testing, kliniske studier og FDA-godkjenning (figur 1). AI og integrerende beregningsbiologiske analyser har blitt brukt på praktisk talt alle disse trinnene – fra å identifisere diagnostiske/prognostiske/prediktive biomarkører og mulige legemiddelmål, via automatisering av screening og optimalisering av molekyler, til å veilede kliniske studier og pasientutvelgelse, og til og med bidra til å skrive patenter for vellykkede legemidler. Overvåket og uovervåket maskinlæring, tekst- og bildebehandling, tekstsyntese og robotautomatisering med beregningsbasert bildekarakterisering utgjør den rike «AI-verktøykassen» av algoritmer for legemiddelutviklingsprosessen.

I økende grad kommer rikere biomedisinske data og mer omfattende analyser og modellering nærmere å oppnå ekte presisjon eller personlig tilpasset medisin. Vi har en gradvis forbedret forståelse av hvordan mutasjoner påvirker proteininteraksjoner (3). Denne informasjonen gjør det igjen mulig for oss å forutsi hvordan interaktomet omkobles hos individuelle pasienter, og hvordan dette påvirker legemidlets virkningsmekanisme, og dermed pasientens respons på behandling (4). Forbedret bildeanalyse muliggjør ikke-invasiv overvåking av pasientens respons på behandling og forbedrer dermed data fra kliniske studier.

Stor avgang og økende kostnader for hvert trinn er de største utfordringene i den tradisjonelle legemiddelutviklingsprosessen.
Figur 1. Stor frafallsrate og økende kostnader for hvert trinn er de største utfordringene i den tradisjonelle legemiddelutviklingsprosessen.

 

Dr. Lacoste

AI kan forbedre eksperters kunnskap og evne til å finne innsikt i legemiddelutvikling på flere måter. En av dem er å intelligent fordøye og oppsummere den enorme mengden vitenskapelig informasjon som publiseres. Teknikker som naturlig språkbehandling og tekstutvinning kan identifisere biomedisinske termer og sammenhenger mellom disse termene, for eksempel gener som er involvert i en sykdom, ved å skanne og tolke den vitenskapelige litteraturen. Informasjon hentet fra tekst kan kombineres med databaseinformasjon slik at forskere kan forsterke kunnskapen sin rundt et legemiddel, gen eller sykdom. I tillegg til å forbedre eksperter direkte, kan aggregert informasjon brukes av algoritmer til å foreslå nye forskningsområder. For eksempel bruker målidentifikasjonsalgoritmer kjent informasjon til å foreslå nye mål eller veier for en sykdom av interesse. Disse algoritmene kommer i forskjellige former. Forskere kan bruke regler på et kunnskapsnettverk for å identifisere gener som kan være nært relatert til en sykdom av interesse gjennom felles mekanismer med andre gener, for eksempel. I andre varianter kan eksperter lære systemet å lære av seg selv, vanligvis basert på kjente eksempler og gjennom maskinlæringsmetoder. AI brukes også i økende grad til personlig medisin: å identifisere pasientgrupper som kan respondere best på en spesifikk behandling. I dette tilfellet fungerer AI på lignende måte ved å analysere enorme mengder data, ofte både genetiske og kliniske, for å foreslå pasientgrupper og behandlinger. Til slutt brukes AI til å designe bedre forbindelser mer effektivt. AI kan designe forbindelser basert på multiparametriske optimaliseringer som tar hensyn til egenskaper kjemikere søker å optimalisere for et molekyl, for eksempel stabilitet og bindingsaffinitet. 

Hva er de nåværende fordelene og begrensningene med AI i legemiddelutvikling?

Dr. Jurisica

AI tilbyr flere betydelige fordeler i forhold til den tradisjonelle legemiddelutviklingsprosessen; for eksempel å finne løsninger vi ellers ville gått glipp av, gi rikere annotering og finne flere løsninger raskere og dermed billigere sammenlignet med tradisjonelle strategier. Det finnes mange vellykkede akademiske eksempler på bruk av AI i legemiddelutvikling, og hundrevis av AI-selskaper jobber innen dette feltet. I 2019 samlet Deep Knowledge Analytics en liste over de 100 beste akademiske og industrielle lederne innen AI innen legemiddelutvikling og avansert helsevesen (5).

For å maksimere fordelene med AI-algoritmer er det nyttig å vurdere hele arbeidsflyten for legemiddelutvikling. AI alene ville ikke bringe oss langt – mens AI-verktøykassen inkluderer nyttige tilnærminger innen maskinlæring, datautvinning og kunnskapsrepresentasjon, trenger vi data av høy kvalitet, rike ontologier og annoteringer, og mange ikke-AI-tilnærminger, som grafteori (6). Gjennom årene har nøyaktigheten og hastigheten til AI-algoritmer forbedret seg enormt, ofte takket være fremskritt innen databehandlingsplattformer. Et slikt eksempel inkluderer en nylig vellykket anvendelse av konvolusjonelle nevrale nettverk ved bruk av GPU-akselerasjon (7), som inkluderer bildeanalyse samt bioaktivitetsprediksjon i strukturbasert legemiddelutvikling (8).

Selv om det har blitt gjort fremskritt, inkluderer hovedutfordringen for mange nåværende applikasjoner begrenset overføringslæring (dvs. å flytte fra ett applikasjonsdomene til et annet uten omtrening), og et systems (manglende) evne til å forklare løsningen. Forklarbar AI diskuteres, men mange systemer fungerer som «svarte bokser» – de gir en løsning, men forklarer ikke «hvorfor» og «hvordan» den ble nådd. Det finnes mange eksempler som fremhever hvordan noen systemer tar en ganske riktig beslutning eller gir en rimelig løsning, men av feil grunner. Nøye kontroll av egenskaper og begrensning av skjevheter i treningsdata, og å vurdere hvilke funksjoner som trekkes ut og brukes under læring, er avgjørende. Spesielt innen det medisinske feltet trenger vi full åpenhet om resonnementet og fullstendig kontroll over trenings- og valideringsprosessene. Systemet må også kjenne sine begrensninger, og gi et «jeg vet ikke»-svar i stedet for en sannsynlig løsning som er feil. Å sikre at vi kan estimere tillit til en gitt prediksjon, i stedet for bare et kohortbasert estimat, er nødvendig for individualisert medisin.

Selv om vi har store mengder molekylære data om pasienter med spesifikke sykdommer, har vi fortsatt svært begrenset informasjon om pasientene selv. Å forbedre hastigheten og nøyaktigheten ved å oppdage ikke-invasive biomarkører, måle mikrobiomet og dets endringer, vurdere døgnrytmen og dens effekt på behandling, måle informasjon om livsstil, søvn osv. fra bærbare enheter vil gi den nødvendige tilleggsinformasjonen for å forbedre vår forståelse av hvorfor og hvordan pasienter reagerer på behandling (9). Samspillet mellom immunsystem, fysisk aktivitet, hormoner og legemidler må vurderes samlet for å ta behandlingen til et nytt nivå av personalisering. Å forstå hvordan vi eldes, hvordan disse prosessene er relatert til sykdom, og hvordan vi kan kontrollere dem, vil gi nye mål for legemiddelutvikling (10). AI er en viktig komponent for alle disse ulike oppgavene. 

Dr. Lacoste

AI er ofte begrenset av kvaliteten, mengden og tilgjengeligheten av data. Et av hovedverktøyene i AI, maskinlæring, krever ideelt sett mange treningseksempler, både positive og negative, for å fungere bra. Faktisk opplevde maskinlæringsfeltet en stor gjenoppliving og forbedring i teknologi etter lanseringen av et treningssett bestående av håndtegnede sifre (MNIST). Maskinlæringsalgoritmer lærer ved å identifisere mønstre i de positive og negative eksemplene. Imidlertid ser forskere vanligvis etter legemidler der det er få eller ingen som er effektive for øyeblikket. For eksempel, når vi søker etter å gjenbruke legemidler for L-dopa-indusert dyskinesi (LID), brukte kollegene mine og jeg en liste over legemidler som har vist en reduksjon av LID i dyremodeller som en proxy for det vi lette etter: effekt hos mennesker (11). Negative eksempler er enda vanskeligere å finne siden fravær av positive resultater i et eksperiment faktisk ikke betyr at objektet som testes er negativt; det kan være at eksperimentet ikke fungerte eller ikke er godt egnet. I tillegg til problemer med treningsalgoritmer, gjør mangelen på positive og negative eksempler det vanskelig å vurdere om en algoritme forutsier verdifulle data uten å kjøre langvarige og kostbare eksperimenter. Denne databegrensningen er noe AI står overfor, spesielt innen «oppdagelses»-felt, mye mer enn i andre felt der AI vanligvis brukes, for eksempel anbefalingssystemer eller bildegjenkjenning.

Til tross for noen av disse utfordringene, er mulighetene store. Etter hvert som feltet vokser, vil vi utvikle flere referansedatasett som vil muliggjøre større sprang. Vi har allerede sett noen tidlige suksesser der AI kan akselerere oppdagelser innen målidentifisering eller optimalisering av forbindelser, og enda imponerende, kan anbefale nye forskningsveier som eksperter ikke ville ha prioritert på egenhånd. Jeg tror sterkt på at AI innen legemiddelutvikling krever at biomedisinske eksperter er medutviklere av teknologiene for å lykkes (12).

Sammendrag:

Farmakologisk behandling av de fleste bevegelsesforstyrrelser er fortsatt en stor utfordring, og det er derfor fortsatt et stort behov for nye terapier. Som beskrevet ovenfor har bruken av kunstig intelligens potensial til å fremskynde den tradisjonelle legemiddelutviklingsprosessen, avdekke nye mål og veier som kan brukes til legemidler, og til slutt legge til rette for levering av ekte presisjonsmedisin. Eksempler på tidlig arbeid med kunstig intelligens for legemiddelutvikling ved bevegelsesforstyrrelser inkluderer legemiddelscreeningskampanjer for å identifisere legemidler som kan redusere levodopa-indusert dyskinesi (11) eller hemme alfa-synukleinoligomerer (13). Arbeidet så langt er i en innledende fase, men det forventes at kunstig intelligens vil bidra til å endre behandlingslandskapet for bevegelsesforstyrrelser. Som i alle områder av vitenskapelig oppdagelse gjelder ordtaket «søppel inn, søppel ut» for kunstig intelligens-drevet forskning. For å gjøre kunstig intelligens til et effektivt verktøy for legemiddelutvikling ved bevegelsesforstyrrelser, må vi derfor fortsette å støtte og samarbeide om både innsamling og deling av data av høy kvalitet.     

Referanser:

1) Esteva A et al. Klassifisering av hudkreft med dype nevrale nettverk på dermatologisk nivå. Nature 2017;542:115–118.
2) Hollon TC et al. Nær sanntids intraoperativ diagnose av hjernesvulster ved bruk av stimulert Raman-histologi og dype nevrale nettverk. Nat Med 2020;26:52-58.
3) IMEx Consortium Curators et al. Fangst av variasjoners innvirkning på molekylære interaksjoner i IMEx Consortiums mutasjonsdatasett. Nat Commun 2019;10:10.
4) Mandilaras V et al. TP53-mutasjoner ved høygradig serøs eggstokkreft og innvirkning på kliniske utfall: en sammenligning av neste generasjons sekvensering og bioinformatiske analyser. Int J Gynecol Cancer 2019 pii: ijgc-2018-000087.
5) www.ai-pharma.dka.global/ai-leaders/
6) Huang LC et al. Grafteori og nettverkstopologiske metrikker kan være potensielle biomarkører ved Parkinsons sykdom. J Clin Neurosci 2019;68:235-242.
7) www.nvidia.com/en-us/deep-learning-ai/solutions/data-science/
8) www.atomwise.com/
9) Holzinger A et al. Hvorfor bildedata alene ikke er nok: AI-basert integrering av bildebehandling, omikk og kliniske data. Eur J Nucl Med Mol Imaging 2019;46:2722-2730.
10) www.bioagelabs.com
11) Johnston TH et al. Gjenbruk av legemidler for behandling av l-DOPA-indusert dyskinesi ved Parkinsons sykdom. Neuropharmacology 2019;147:11-27.
12) www.statnews.com/2019/11/01/ai-revolutionize-drug-discovery-experts-involved/
13) Maclagan LC et al. Identifisering av legemidler med sykdomsmodifiserende potensial ved Parkinsons sykdom ved bruk av kunstig intelligens og farmakoepidemiologi. Pharmacoepidemiol Drug Saf. 2020. mai 14. doi: 10.1002/pds.5015

Send inn din kommentar

Følgende obligatoriske elementer ble ikke oppgitt eller er i feil format. Vennligst oppgi de nødvendige svarene og send inn på nytt:

Navn
Kommentartittel
Kommentar: 1000 tegn
  [[skriv inn feilmelding her]]