Uusi tapa tehdä kontrolloituja kokeita lääketieteessä: simuloi kontrollointia

Generatiivinen tekoäly voi tarjota keinon täydentää satunnaistettuja kontrolloituja tutkimuksia (RCT) ja tehdä niistä halvempia ja tarkempia.

Satunnaistetussa kontrolloidussa tutkimuksessa (randomized controlled trial, RCT), joka on uusien lääkkeiden ja hoitojen testauksen kultainen standardi, eettisyys ja potilasturvallisuus törmäävät tilastoihin. Jotta voidaan sanoa tilastollisella varmuudella, että hoidolla, kuten uudella lääkkeellä, on ollut vaikutusta, suuri määrä potilaita jaetaan RCT-tutkimuksessa yleensä kahteen ryhmään, jotka ovat muuten samanlaisia, paitsi että toinen saa lääkettä tai hoitoa ja toinen ei. Kahden "haaran" ottaminen tutkimukseen vaatii paljon ihmisiä, voi olla kallista ja kalliiden lääkkeiden tai harvinaisten sairauksien tapauksessa eettisesti ongelmallista.

Mahdollisuus tehdä RCT-tutkimus, jossa on vain yksi haara, on siksi houkutteleva, ja se on aktiivinen keskustelun ja tutkimuksen ala, sanoo Manuel Haussmann, joka on väitöskirjatutkija Etelä-Tanskan yliopistossa. "Ajatus RCT-tutkimusten laajentamisesta sähköisistä terveyskertomuksista tai synteettisistä tiedoista saaduilla tiedoilla on yleistymässä, ja tähän on ehdotettu erilaisia tapoja koneoppimisen avulla." Haussmann, joka kehitti tätä työtä post doc -tutkijana Suomen tekoälykeskus FCAI:ssa, ja hänen kollegansa ovat hiljattain julkaisseet tavan tunnistaa potilaita reaalimaailman tiedoista RCT-tutkimuksen kontrolliryhmää jäljitteleväksi, mikä tarkoittaa käytännössä simuloidun kontrolliryhmän luomista vastaamaan todellista hoitoryhmää. Heidän työnsä esitellään AISTATS-konferenssissa toukokuun alussa 2024.

Tutkimuksessa hyödynnetään laajoja sähköisiä terveyskertomuksia, jotka ovat saatavilla turvalliseen käyttöön Suomessa. Näiden terveystietokantojen korkea taso ja tietosuojalainsäädäntö ovat maailmanlaajuisesti melko ainutlaatuisia, sanoo Haussmann, ja ne mahdollistivat FCAI:n, Helsingin yliopistollisen sairaalan ja Bayerin tutkimusyhteistyön.

Tutkijoiden oli sovitettava jokainen hoidettu potilas yhteen simuloidun potilaan kanssa, jotta synteettinen kontrolliryhmä saatiin luotua onnistuneesti. Tässä kohtaa syväoppimismalli astuu kuvaan. "Kahta ryhmää ei voi helposti sovittaa yhteen. Rakensimme mallin, joka luo korkean tason yhteenvedon kaikista mahdollisista muuttujista, kuten iästä ja sukupuolesta, valtavassa sairaus- ja diagnoosihistoriassa, ja sitten sovittaa potilaat yhteen niiden ominaisuuksien perusteella, jotka ovat tärkeitä RCT:n lopputuloksen ennustamisen kannalta", Haussmann selittää.

Koska tämäkin laaja historiatieto voi olla puutteellinen, malliin sisältyy generatiivinen elementti, joka voi täyttää aukkoja. "Generatiivinen osa on tärkeä puuttuvien tietojen ja kohinaisten havaintojen, kuten esimerkiksi verikokeiden vaihtelun, käsittelyssä", Haussmann sanoo. Generatiivinen on tässä tapauksessa toinen sana sanalle "probabilistinen" eli sille, miten tarkasti malli on oppinut ja tiivistänyt sen, mikä potilaista on todella merkitsevää kliinisen tutkimuksen lopputuloksen ennustamiseksi.

Terveystietoja on valtava määrä, ja tämä on iso askel kohti niiden hyödyntämistä, Haussmann sanoo. "Emme voi päihittää RCT-tutkimusten laatua, mutta voimme oppia, miten potilaat voidaan sovittaa optimaalisesti yhteen koneoppimisen avulla, mikä osoittaa, että yhden haaran tutkimukset ovat toteuttamiskelpoisia."

Lähde:

Manuel Haussmann, Tran Minh Son Le, Viivi Halla-aho, Samu Kurki, Jussi Leinonen, Miika Koskinen, Samuel Kaski, and Harri Lähdesmäki (2023). "Estimating treatment effects from single-arm trials via latent-variable modeling." doi: 10.48550/arXiv.2311.03002

Lue lisää: Bayer, FCAI ja HUS laajentavat yhteistyötä - tekoäly kliinisen lääketutkimuksen avuksi