Volyymit kaakkoon: Puhe on tekoälyn käytetyimpiä sovelluksia 2019

Puheentunnistus, puheohjaus puhehaku ja äänikäyttöliittymä ovat tekoälyn isoimmin nousevia aaltoja vuonna 2019. Erityisesti Yhdysvalloissa on saavutettu kriittinen massa laitteissa, käyttäjissä ja sovelluksissa.
Puheohjaus arkipäiväistyy nopeasti. Kun ”puhuva” kone hoitaa asiointimme sujuvasti, ohitamme näppärästi filosofisen kysymyksen siitä, ymmärtääkö kone todella mitään.
Meille riittää, että homma toimii. Olemme niin tottuneet hoitamaan töitä, arkea ja vapaa-aikaa erilaisilla sovelluksilla, että puhetta totteleva käyttöliittymä on helppo hyväksyä.
 

Jenkit puhuvat, muut seuraavat

Yhdysvallat on tässä kaikkia muita edellä. Vuoden 2018 päättyessä peräti 41 % sikäläisistä kotitalouksista omisti puheentunnistuksella toimivan erillisen älykaiuttimen (smart speaker). Laitepenetraation kasvu on erittäin nopeaa: laitteiden määrä lähes tuplaantui vuodentakaiseen verrattuna.
Valtaosa älykaiuttimista oli Amazon Echo -laitteita ja huomattavasti pienempi, mutta nopeasti kasvava määrä Google Home -laitteita. Applen ja Microsoftin kaiuttimet tulevat kaukana perässä. Keskimäärin kotitaloudet omistavat jo 1,7 älykaiutinta, eli laitteiden ostokynnys on varsin matala.
Tietenkin käytännössä jokaisella meistä on kännykässään käyttövalmiina puheentunnistimena joko Googlen Assistant tai Applen Siri. Yhdysvalloissa näitäkin käytetään enemmän kuin muilla markkinoilla ja siellä myös Amazon Alexa -appi yleistyy puhelimissa nopeasti.
Yhdysvalloissa on alan edistynein sovelluskehitys, eniten käytössä olevia laitteita ja tällä hetkellä laajin markkina. Se näyttää suuntaa muulle maailmalle.
Keskustelu Suomessa harhautuu usein pieneen kielialueeseemme. Kansantalouden ja kansainvälistyvien kasvuyritystemme kannalta on olennaisempaa nähdä ne mahdollisuudet, joita puhekäyttöliittymät tarjoavat kaikilla suurilla markkinoilla.
Tietenkin on paljon tilanteita, joissa puhekäyttöliittymä ei ole tarkoituksenmukainen tai ylipäätään mahdollinen. Puhe on silti isoimpia tekoälytrendejä vuonna 2019!
 

Mistä nopea kasvu johtuu?

Positiivinen kierre: Koneoppiminen, nopeat mobiiliyhteydet ja kasvanut prosessoriteho synnytti puheentunnistuksen läpimurron. Kännykällä puheentunnistuksen voi viedä kaikkialle ja käyttämisen kynnys on matala. Algoritmit saavat jatkuvasti lisää dataa ja oppivat paremmiksi. Paraneva tunnistuskyky saa puolestaan yhä useammat luottamaan äänikäyttöliittymiin. Tämä synnyttää yhä lisää ja yhä laadukkaampaa sovellustarjontaa.
Käyttötilanne ohjaa: Kun konteksti on selvä, kone ymmärtää englanninkielisen puheesi erinomaisesti. Muut valtakielet tulevat lähellä perässä. Kriitikot epäilevät, voiko kone koskaan tajuta kielen hienovaraisuuksia. Käytäntö on kuitenkin osoittanut, että valtaosa koneille antamistamme tehtävistä tapahtuu niin selkeässä käyttötilanteessa, että tulkintavaikeuksia on yllättävän vähän. Tehokkuus- ja käytettävyyshyödyt peittoavat virheet.
Yhä useammissa tilanteissa kuluttaja haluaa viestiä koneelle, ei ihmiselle: Selvitysten mukaan iso osa – jopa enemmistö – kuluttajista hoitaa asiointia mieluummin sovelluksen kuin ihmisen kanssa. Äänipohjainen käyttöliittymä on luontaista jatkoa tälle. Yhtä luontaista on, että ihmiset oppivat nopeasti valitsemaan ne käyttötilanteet, missä puhe on luontevaa ja missä ei.
 

Mitä on meneillään: muutamia esimerkkejä

Alexa Skills näyttää suuntaa: Samalla tavalla kuin kuka tahansa voi kehittää iOS- tai Android-appeja, kuka vain voi kehittää Amazonin Alexa-platformille puhekäyttöliittymään perustuvia Skills-sovelluksia. Vain mielikuvitus on rajana.
Tällaisia sovelluksia on Yhdysvalloissa tarjolla 60 000 erilaista, Isossa-Britanniassa 30 000 ja saksankielisenäkin 8 000. Erot kielialueiden välillä ovat jyrkät, koska laitepenetraatio on keskittynyt Yhdysvaltoihin. Japaniksi sovelluksia on vain pari tuhatta ja ranskaksi vain tuhatkunta.
Sovellusplatformina Alexa seuraa samanlaista kehityspolkua kuin Android- ja iOS-sovelluskaupat. Kolmansien osapuolien kehittämä valtava tarjonta on avain platformin menestykseen.
Kiina on oma tarinansa: Englannin ansiosta teknologian aikaiset omaksujat ja koulutetut kuluttajat ottavat puheentunnistuksen toimintoja käyttöön kaikkialla. Muut isot kielialueet tulevat englannin perässä ja kehittyvät nopeasti. Aivan oman blogipostauksensa aihe on kuitenkin Kiina. Siellä kehitetään puheentunnistusta isoilla resursseilla, mutta sovelluksille ei ole vielä löytynyt välitöntä vientipotentiaalia. iFlytek tarjoaa omaa puheentunnistusalustaansa sovelluskehittäjille ja laskee Kiinassa käyttäjikseen jopa 500 miljoonaa ihmistä.  Tencent kehittää omaa ääniohjattua assitenttiaan WeChat -palveluunsa ja kaikki muutkin suuret toimijat ovat aktiivisia. Jokaisella isommalla toimijalla on myös omat tytäryhtiönsä tai työryhmänsä englanninkielistä markkinaa ja kielen tosiaikaista tulkkaamista varten.
Käyttö on viihdettä, tiedonhakua ja elämänhallintaa: Käytännössä puheohjauksen käyttökohteet kotona ovat viihdettä (spotify, radio, podcastit, audiokirjat, pelit), tiedonhakua (hakukoneet, uutiset, urheilutulokset, sää, aikataulut) ja elämänhallintaa (muistilistat, kalenterit, hälytykset, ajastimet).
Musiikin soittaminen on käyttötilastojen ykkönen, samoin kuin yksinkertaiset komennot esimerkiksi ajastimen asettamiseen, uutisten lukemiseen, tai sääennusteeseen. Suosittujen sovellusten joukossa on myös pelejä – siis älykaiuttimella pelattavia pelejä, joissa ainoa elementti on ääni.
Puhetta ymmärtävä älykoti kiinnostaa vain vähemmistöä: Halutessasi tekoäly kuuntelee Amazon Echo -kaiuttimen kautta tyhjää kotiasi ja tunnistaa tyypillisiä murtotilanteen ääniä. Kaiutin voi myös säätää valoja ja se voi vaihtaa esimerkiksi Sonyn Android-käyttöjärjestelmällä varustetun television kanavia. Tällaiset älykotiin miellettävät ominaisuudet eivät kuitenkaan nouse käyttötilastojen kärkeen, vaan ihmiset käyttävät puheohjausta hyvin samantapaisten asioiden hoitamiseen kuin kännykkääkin.
Yrityksiä kiinnostaa asiointipalvelu: Chatbottien seuraava askel on hyppy tekstinymmärryksestä puheenymmärrykseen. Tarkkaan rajatuissa käyttötilanteissa tämä on arkea jo vuonna 2019.
Puheentunnistus taipuu moneen tarkoitukseen: Tanskalainen yhtiö Corti kehittää tekoälyä, joka kuuntelee hälytyskeskuspuheluja ja pyrkii tunnistamaan soittajan äänestä ja sanoista tyypillisiä merkkejä sydäninfarktista. Tämä on tärkeää, koska jokainen yksittäinen minuutti, joka puhelimessa kuluu ennen avun lähettämistä ja elvytyksen aloitusta laskee eloonjäämisen mahdollisuutta 7-10 %. Tarinaan kuuluu myös se, että vertailtaessa ihmisiin, Cortin tekoäly oli diagnooseisaan sekä useammin oikeassa että nopeampi.
Autoissa yleistyy ääniohjaus, ei itseohjaus: Tekoäly tulee vuoden 2019 ja 2020 aikana lähes kaikkiin uusiin premium-autoihin. Itseajavien autojen sijaan tekoäly lyö läpi tietoviihdejärjestelmien ja viestinnän puheohjattuna käyttöliittymänä. Amazon on tehnyt sopimuksia useiden autovalmistajien kanssa Alexan integroinnista auton multimedialaitteisiin.
Osa valmistajista tarjoaa useita ratkaisuja samalla kertaa. Esimerkiksi BMW:llä on kaikissa uusissa autoissa oma Intelligent Personal Assistant ja sen rinnalla valmiiksi asennettuna myös Alexa. Tietenkin Amazon tarjoaa Alexa-pohjaisen Echo-kaiuttimen myös jälkiasennettavana lisälaitteena mihin tahansa autoon. Samoilla apajilla on Google Assistant, joka löytyy esiasennettuja useiden kymmenien eri automerkkien valikoiduista malleista ja on tarjolla myös jälkiasennusvaihtoehtona.
Mihinkään ajamisen kannalta kriittiseen järjestelmään autovalmistajat eivät kolmansien osapuolien salli kytkeytyä.
Ääni ohjaa isojen platformien syliin: Kehittynyt puheentunnistus on niin vaativa laji, että valtaosa sovelluskehittäjistä tilaa isoilla kielialueilla tunnistuksen perusteknologian Amazonilta, Googlelta, Microsoftilta tai Applelta pilvipalveluna. Se takaa, että perustunnistus kehittyy koko ajan ja sovelluskehittäjä pääsee itse keskittymään toiminnallisuuteen. Toisaalta se tekee täysin riippuvaiseksi isoista platformeista.

Laita verkkoliiketoimintasi kasvuun

Varaa nyt tehokas lietsontasessio