Kohti parempaa puheentunnistusta: Lahjoita puhetta -kampanja palkittiin parhaana mobiilipalveluna
Onnistuneen kampanjan vuoksi Suomella on mahdollisuus toimia puheentunnistuksen pienten kielten pioneerina, kertoo professori Mikko Kurimo.
Parempaan suomenkieliseen puheentunnistukseen tähtäävä Lahjoita puhetta -kampanja sai Grand One -mediapalkinnon kategoriassa Paras mobiilipalvelu. Grand One on Suomen suurin digitaalisen median kilpailu, ja voittajat julkaistiin virtuaaligaalassa 29.4.2021. Kampanja sai myös kunniamaininnan kategoriassa Paras datan käyttö.
Lahjoita puhetta -kampanjan tarkoituksena on saada kerättyä mahdollisimman paljon erilaista puhuttua suomea. Kerätyn puheen avulla kehitetään puheentunnistusta ja tekoälyä ymmärtämään paremmin suomenkielistä puhetta. Yleishyödyllisessä hankkeessa ovat mukana esimerkiksi YLE, Helsingin yliopisto, Valtion kehitysyhtiö Vake (nyk. Ilmastorahasto) sekä Aalto-yliopisto. Puhetta voi lahjoittaa tietokoneen selaimella tai puhelinsovelluksella. Tutustu kampanjaan tarkemmin täällä.
Aalto-yliopiston puheentunnistuksen tutkimusryhmää johtava professori Mikko Kurimo kertoo puhuneensa aiheen tärkeydestä eri tilaisuuksissa jo kymmenien vuosien ajan. Kurimolla on ollut kampanjan toteutumisessa tärkeä rooli. Hän on muun muassa ohjannut sitä, millaista dataa kannattaa kerätä, kuinka paljon sitä tarvitaan ja keneltä sitä kannattaa kerätä. Puhuttua suomea on nyt kerätty lähes 4000 tuntia, joten seuraavaksi Kurimon tutkimusryhmä kehittää automaattisia menetelmiä datan tarkastukseen, korjailuun ja annotointiin eli aineiston kuvaamiseen ja luokitteluun.
Muut kielet laahaavat englannin perässä
Miksi suomenkielistä puheentunnistusta on sitten tarpeen kehittää? Puheentunnista hyödynnetään yhä enemmän erilaisissa tärkeissä sovelluksissa, kuten puheohjauksessa, puhehaussa, sanelussa, puheen litteroinnissa, tekstityksessä, tulkkauksessa ja tiedonhauissa. Kurimon mukaan suomenkielisen puheentunnistuksen ongelmista kärsivät ensisijaiset suomalaiset itse ja olisi kurjaa, jos näiden palveluiden käyttö edellyttäisi jatkossakin sujuvaa englannin kielen taitoa.
”Sama tilanne on myös valtaosalla maailman yli 6000 kielestä. Suomella onkin nyt tämän kattavuudeltaan ja avoimuudeltaan ainutlaatuisen datan ansioista mahdollisuus toimia pienten kielten tietoteknisten sovellusten kehityksen pioneerina”, Kurimo kertoo.
Puheen ja kielen tutkimus on itsessäänkin tärkeää, koska se paljastaa tärkeitä asioita ihmisen kommunikoinnista ja käyttäytymisestä – ja suurien aineistojen tutkiminen vaatii myös automaattisten työkalujen kehittämistä.
Lahjoita puhetta -kampanjasta kerätty puhe pitää tutkijat kiireisenä, mutta tutkimusryhmä työskentelee muidenkin mielenkiintoisten projektien parissa. Ryhmä teki vastikään eduskunnan julkisista istuntotallenteista 2008 – 2020 suuren puheaineiston. Lisäksi ryhmässä tutkitaan suullisen kielitaidon tietokoneavusteista mittausta ja harjoittelua, televisio-ohjelmien ja elokuvien tekstitystä sekä haastavien käyttäjäryhmien, kuten lasten ja kielenoppijoiden, puheentunnistusta.
Haluatko osallistua puhetalkoisiin ja parantaa suomenkielistä puheentunnistusta? Kampanja on edelleen käynnissä – lahjoita puhetta osoitteessa lahjoitapuhetta.fi!