Koneoppimismalli sote-palvelukäytön ennakointiin
Asiakas- ja potilastietojärjestelmiin kertyvän datan tehokas hyödyntäminen on avain uusille ennakoiville hoitokäytännöille. Ikääntyneet, joiden osuus sosiaali- ja terveydenhuollon menoista on moninkertainen väestön keskiarvoon verrattuna, on erityisen kiinnostava kohderyhmä. MAITE-hankkeessa tutkittiin, miten tekoälyä voidaan hyödyntää ikääntyneiden monialaisen palvelukäytön ennustamisessa.
Keskeisenä ajatuksena oli identifioida henkilöryhmiä, joilla on keskimääräistä suurempi riski runsaaseen ja monialaiseen sote-palvelujen käyttöön. Yhteishanketta veti THL ja siihen osallistuivat Lapin yliopisto, Helsingin yliopisto, VTT ja Päijät-Hämeen hyvinvointialue. VTT:n tehtävänä hankkeessa oli tekoälypohjaisen ennustemallin prototyypin kehittäminen ja demonstrointi.
Useissa aiemmissa hankkeissa on kehitetty tekoälyyn pohjautuvia malleja tiettyjen sairauksien tai sairausryhmien varhaisen diagnosoinnin tueksi tai taudinkulun ennustamiseksi. MAITE-hankkeessa ennustaminen ei kohdentunut erityisesti mihinkään sairauteen vaan yleisesti sote-palvelujen käyttöön. Keskeistä oli identifioida henkilöryhmiä, jotka käyttävät sote-palveluja muita enemmän ja monialaisemmin. Hankkeessa tarkasteltiin ennustemallin kehittämisen prosessia laajasti pyrkien lisäämään valmiuksia toteuttaa ja ottaa käyttöön tekoälyyn perustuvia ratkaisuja sosiaali- ja terveydenhuollossa.
Ennustemalli kehittyi vaihe vaiheelta
Yhdessä projektikumppanien kanssa määriteltiin tavoitteet ennustemallille sekä ne Päijät-Hämeen asiakas- ja potilasrekistereistä saatavissa olevat tiedot (muun muassa sote-palvelukäyntien yhteydessä tallennetut tiedot), jotka olivat tarpeen ennustemallin toteuttamisessa. Päijät-Hämeen hyvinvointialue myönsi luvan tietojen käyttöön pseudonymisoituina tieteellisessä tutkimuksessa toisiolain mukaisesti.
Aineiston käsittely koneoppimismallin kehittämiseksi tapahtui Findatan tietoturvallisessa Kapseli-käyttöympäristössä. Päijät-Hämeen hyvinvointialueen tietohallinto huolehti aineiston poiminnasta Päijät-Hämeen tietoaltaasta ja aineiston siirrosta Kapseliin. VTT toteutti koneoppimismalliin liittyvän esikäsittelyn, piirteiden valinnan ja mallin opetuksen, validoinnin ja testauksen.
Opetettu ja anonyymiksi todettu koneoppimismalli vietiin VTT:n demoympäristöön, jossa sitä voidaan tutkia esimerkiksi havainnollistamalla eri tekijöiden vaikutusta henkilön ei-toivotun palvelukäytön riskiin. Demoympäristöön visualisoitiin interaktiivinen maantieteellinen karttapohja, jonka avulla käyttäjä voi tutustua mallin kehittämisessä käytetyn data-aineiston pääpiirteisiin.
Sote-toimijoiden toiveena oli ennustaa sellaista palvelujen käyttöä, joka ei olisi välttämätöntä tai jota voitaisiin ehkäistä ennakoivilla interventioilla. Tämän toiveen täyttäminen todettiin vaikeaksi, koska ennusteen pohjana olevat asiakas- ja potilastiedot eivät anna tietoa siitä, onko palvelujen käyttö ollut tarpeellista tai onko se ollut ennalta ehkäistävissä. Tämän sijaan ei-toivotun palvelukäytön keskeisinä indikaattoreina käytettiin päivystyskäyntien määrää sekä samanaikaisesti käytössä olevien eri sote-palvelujen määrää.
Malli ennustaa asiakkaan riskin ei-toivottuun palvelukäyttöön
Toteutettu malli ennustaa, onko tiettyyn tarkasteluryhmään kuuluvalla asiakkaalla riski käyttää seuraavana vuonna runsaasti, enenevässä määrin ja monialaisesti sote-palveluja. Syöttötietona malli käyttää henkilön taustatietoja ja sote-palvelujen käyttötietoja edelliseltä kolmelta vuodelta. Mallinnuksessa käytettiin kahta koneoppimismenetelmää: logistista regressiota ja gradienttiohjattua päätöspuuta (XGBoost-algoritmi).
Mallin luokittelutarkkuus (AUC-arvo) molemmilla käytetyillä koneoppimismenetelmillä oli keskimäärin 0.6. Tarkasteluryhmien herkkyyden vaihteluväli oli 30–40 prosenttia, kun spesifisyys kiinnitettiin arvoon 75 prosenttia. Vaikka luokittelutarkkuus ja herkkyys jäävät melko alhaiseksi on tärkeää huomata, että hyödynnettäessä ennustemallia ennakoivien palvelujen kohdentamiseen jo alhainenkin luokittelutarkkuus ja herkkyys voivat olla hyväksyttäviä ja parantaa merkittävästi nykytilannetta. Kohdentamalla ennakoivat palvelut ennustemallin pohjalta, tavoitetaan riskihenkilöitä joka tapauksessa paremmin kuin satunnaisella valinnalla.
MAITE-hanke saavutti tärkeän tavoitteensa tuottaa kokonaisnäkemystä ennustemallien kehittämisestä sote-palveluissa hyödynnettäväksi. Projektissa toteutettu demonstraatio mahdollisti ennustemallin havainnollistamisen sote-ammattilaisille. Sen pohjalta saatiin arvokasta palautetta jatkokehittämiseen.
Ennustemalli soveltuu erityisesti ikääntyneiden palveluohjaukseen
Palautteen perusteella ennustemalli voisi olla hyödyllinen erityisesti ikääntyneiden palveluohjauksessa ja seulonnassa ennakoivia interventioita varten edellyttäen, että sovellus on todettu lainsäädännön mukaiseksi ja integroitu hyvinvointialueen olemassa olevaan sovellusympäristöön.
Hanke opetti, että dataa hyödyntävien ja tekoälyyn pohjautuvien ratkaisujen kehittäminen edellyttää laajaa yhteistyötä eri toimijoiden välillä sekä erityisesti käyttäjäorganisaation—tässä tapauksessa Päijät-Hämeen hyvinvointialue—sitoutumista kehittämiseen.
Tekoälyyn pohjautuvan mallin hyödyntämiseen operatiivisessa sote-palvelussa liittyy myös lainsäädännöllisiä näkökulmia, joita MAITE-hankkeessa on selvittänyt Lapin yliopisto.
MAITE-hankkeen loppuraportti on luettavissa tästä linkistä.
Kirjoittajat VTT:ltä: johtava tutkija Jaakko Lähteenmäki, erikoistutkija Juha Pajula, tutkija Heba Sourkatti