Data tulee ennen analytiikkaa

Harri Takala
Kirjoittaja: Harri Takala 24.5.2018 11:29

Aihe: Data, Analytiikka

Data-analytiikka on kaikkien tulevaisuutta ennustavien julkaisujen varmana voittajana. Se on tienjakaja, joka erottelee jyvät akanoista.

Kun me tämän teeman ympärillä maailmaa katselemme, törmäämme lukemattomiin teknologioihin ja palvelun tuottajiin, jotka johdattavat sinut Eldoradoon rikkauksien äärelle. Koneoppimista kuumempaa hottia on vain automatisoitu koneoppiminen. Uudet tuulet tuovat mukanaan jotain sellaista, mitä me emme ole kyenneet edes ymmärtämään. Ehkä muutakin kuin ison laskun loppumattomasta projektista, jonka takaisinmaksulaskelma ei avaudu edes kamreerille?

Onko sinun organisaatiosi toiminnassa asioita, joista et vain tiedä tarpeeksi? Tai ehkä tärkeämpänä kysymyksenä, jos tietäisit, olisiko sinulla avaimet menestykseen hyppysissäsi? Organisaatiosi silmiesi edessä avautuisi kuin Matrix Neolle. Prosessit sellaisena kuin luulit niin olevan, olivatkin vain tietämättömyyden verhon takana. Olit aina katsellut vain sinulle annettua lumetodellisuutta ja silmäsi ovat ensimmäistä kertaa avautumassa. Ja useimmat kollegasi ovat olleet samassa sadussa, epäilevät Tuomaat ovat olleet häiriköitä ilman isoon kuvaan liittyvää ymmärrystä. Neolle tarjottiin sinistä pilleriä, jolla uni jatkuu ja punaista joka avaa hänen silmänsä. Mutta lupauksena silmien avaamisesta olisi vain totuus.

Data-analytiikka on sinun organisaatiosi punainen pilleri.

Harva organisaatio kärsii datan puutteesta

Ennen kuin tilaat uudet robotit ja laitat Data Scientistin hakuun LinkedIniin, sukelletaan analytiikan alkulähteille. Dataan. Data on itseasiassa yleensä vaikein asia kokonaisuudessa. Harva organisaatio kärsii datan puutteesta, mutta useimmille ongelma on saada se käyttöön. Ja murheena ei ole pätevän datatieteilijän puuttuminen vaan se, että se että datasta ei saa oikein analysoitavaa – se on rikkinäistä.

Mitä kauempana ollaan reguloiduista prosesseista – kuten taloushallinnon toiminnoista – sitä suurempia eheysongelmia dataan liittyy. Eheys ongelmat johtuvat yleensä prosessien ja niihin liittyvien erilaisten sensoreihin ja erityisesti voileivällä käyvien datan tuottajien kyvykkyydestä tuottaa tasalaatuista dataa. Se voi olla vaikka palvelupyynnön oikea luokittelu, arvioitu tekemiseen kulunut aika tai tulon kohdistaminen oikealle yksikölle. Mitä enemmän datan syöttämiseen liittyy tulkinnanvaraa, sitä enemmän harkintaa sen analysointiin on käytettävä.

Hyvin usein ongelman muodostavat prosessit, jotka ohittavat tiedonkeruupisteen. Tämä tarkoittaa vaikkapa sitä, että suunnittelija jättää aina rekisteröimättä tuotantomuutokseen liittyvän mallin päivittämisen ja tähän käytetty aika ei koskaan kerrytä tuotekustannusta. Tai varastomies jättää säännönmukaisesti varastonsiirron kirjaamatta ja varastosaldot eri alueiden välillä ovat aina inventoitaessa väärin. Käytännössä onkin jopa surkuhupaisaa, että kun me alamme ottamaan teknologiaa töihin, meidän tulee ensin korjata ihmisen tekemistä. Datan keruu ja analysointi voivat kuitenkin olla välttämättömiä tekijöitä prosessin korjaamisessa.

Data - saat sitä mitä mittaat

Vanha totuus: sitä saat mitä mittaat, pätee myös tässä. Datan laatu paranee kummasti, kun sen sisältöön aletaan kiinnittää huomiota. Joskus analytiikan kehittäminen kannattaa aloittaa vaikka raportin rakentamisella – tietoisena siitä, että raportin antamat lopputulokset olisivat soveltuvia myös pehmopaperille painettavaksi. Mutta sen avulla päästään kuitenkin usein kiinni datan ja prosessin ongelmiin ja tunnistetaan kokonaisuuksia, jotka ovat ihan metsässä.

Jokainen myyntijohtaja tietää minkälainen matka on saada sales pipeline sellaiseksi, että sen uskaltaa lisätä hallitusraporttiin ilman muokkauksia. Hyvin harvoin koko riemunkirjava myyntijoukko on tehnyt asiat samalla laadulla, vaan usein pipeline on pielessä parin myyjän päivittämättömän tarjouskannan vuoksi. Koko pipeline korjaantuu kun heidänkin työn sisältö saadaan kirjoihin ja kansiin. Eheys ei loppujen lopuksi olekaan niin suuri ongelma kuin se, että mitä pipelinen päästä on tippumassa kaupoiksi.

Datan suhteen meillä on tyypillisesti ongelmia myös sen määrässä. Toimintaympäristömme sisältää valtavasti erilaisia tietolähteitä ja mitä enemmän me teknologiaa otamme käyttöön, sitä enemmän meillä on myös dataa saatavilla. Digitalisaation voima liittyy nimenomaan dataan ja sen tehokkaaseen ja älykkääseen käyttöön. Automaatio, robotiikka, erilaiset IoT-laitteet ja muut uudet teknologiat perustavat toimintansa dataan ja ne tarjoavat sitä valtavia määriä myös analysoitavaksi.

On hallittava integraatiot ja rajapinnat

Ennen kriittinen – tai ehkä oikeammin saatavilla oleva data, sijaitsi siinä yhdessä ERP:issä. Nyt organisaation datalähteet ovatkin yhä useammin hajallaan eripuolilla organisaatiota lukuisissa järjestelmissä ja yhä useammin myös pilvipalveluissa. Datan haaliminen analysoitavaksi tarkoittaa integraatiota ja rajapintojen hallintaa ja hyvin usein myös esikäsittelyä ja suodatuksia suoraan datalähteellä.

Välillä tämä massa sokeuttaa meidät ja metsä katoaa puilta. Oleellista on ymmärtää data-arkkitehtuuri ja erilaisten sovellusten ja datalähteiden roolit. Laskutukseen liittyviä asioita voidaan käsitellä vaikka minkälaisissa työkaluissa monimutkaisten integraatioiden tukemana, mutta usein loppujen lopuksi se kaikkein tärkein rivi löytyy siitä järjestelmästä, mikä johtaa asiakkaan ostoreskontran suoritukseen. Jotta osaat kaivaa oikeaa tietoa, sinun tulee ymmärtää sovellusarkkitehtuuri ja järjestelmien roolit.   

Datan keruu – tai ehkä korostetummin, oikean data keruu on perusta data-analytiikalle. Se on kuitenkin vasta matkan alkupiste ja tässä vaiheessa me emme ole oikeastaan saavuttaneet mitään muuta kuin kenties datavaraston levytilan hälytysrajan. Jotta tällä kaikella on merkitystä, tulee kulkea vielä pitkä matka eteenpäin.

”There is no spoon.” Totuutta tarjotiin Neollekin heti alussa, mutta ennen kuin hän ymmärsi asian oikeasti, oli hänen opittava maailmasta ympärillään ja kuljettava siinä eteenpäin. Kun me olemme saaneet datavirrat hallintaan ja päässeet kiinni niiden mahdollisuuksiin, alkaa informaation tuottaminen.

Matrixissa oli jatko-osa ja niin on tässäkin tarinassa.

Harri Takala
CDO
MPY Palvelut 

Blogin kirjoittaja Harri Takala toimii uuden MPY Palvelujen digitalisaatiojohtajana. Hänen taustaltaan löytyy lähes 20 vuoden kokemus tietohallinnon eri osa-alueista. Liiketoimintajärjestelmät, tietoturvallisuus ja tietohallinnon johtaminen kuuluvat Harrin erityisosaamiseen.